Les modèles avancés d’intelligence artificielle (IA) peuvent déjà générer du code informatique et aider à découvrir de nouveaux médicaments. Mais quand il s’agit de reconnaître des objets simples, ils ont encore du chemin à parcourir par rapport aux petites souris.
C'est la conclusion d'une étude publiée dans la revue Patterns , dans laquelle des chercheurs de la Scuola Internazionale Superiore di Studi Avanzati (SISSA) en Italie ont demandé à un modèle d'IA de reconnaissance d'images de tenter de reproduire la capacité de la souris à reconnaître les images tournées, redimensionnées, et des objets partiellement obscurcis.
La vision de la souris est plus « efficace et adaptative » que celle de l’IA
Le modèle d'IA a finalement pu rattraper les capacités de traitement d'image de la souris, mais seulement après avoir utilisé de plus en plus de ressources et de puissance de calcul.
Reconnaître l'objet dans sa position d'origine était facile tant pour l'IA que pour la souris, mais lorsque l'objet était transformé de différentes manières, les chercheurs devaient améliorer les performances du modèle d'IA pour suivre la souris.
Les scientifiques affirment que leurs découvertes démontrent que la vision de la souris, affinée au cours de millions d'années d'évolution, est toujours plus efficace que les systèmes de reconnaissance visuelle les plus puissants d'aujourd'hui.
La vision de la souris diffère de celle des humains de plusieurs manières notables. Tout d’abord, comme beaucoup d’autres mammifères, les yeux des souris sont situés sur les côtés de leur tête, ce qui leur confère un champ de vision plus large, un avantage naturel pour détecter et éviter les prédateurs.
Plus précisément, des recherches antérieures ont montré que les yeux des souris peuvent bouger dans des directions opposées en fonction de la façon dont elles inclinent la tête. Cela les fait paraître « louches » lorsqu’ils baissent la tête.
Dans l’expérience, des souris ont été entraînées à reconnaître des objets sur un écran en recevant des récompenses. Lorsqu’ils identifient correctement l’objet cible, ils activent un capteur tactile.
Pour comparer cette capacité à l’IA, les chercheurs du SISSA ont créé un réseau neuronal convolutif (CNN). Il s’agit d’un modèle d’apprentissage profond avancé, considéré comme l’un des meilleurs systèmes d’IA pour la reconnaissance d’images. Il est lui-même en partie modelé sur le cortex visuel des mammifères.
L'IA a encore beaucoup à apprendre
Le modèle CNN utilise un classificateur pour reconnaître les objets. La classe la plus basique peut gérer et définir des fonctionnalités simples comme les contours et le contraste. D'autres couches sont ajoutées pour reconnaître des images plus complexes. Chaque couche supplémentaire nécessite des ressources et une puissance de calcul supplémentaires, de la même manière que plus une lasagne comporte de couches, plus elle a besoin d'ingrédients.
Ce modèle CNN a ensuite été chargé de reproduire la capacité de la souris à reconnaître des objets dans diverses conditions. Lors de la reconnaissance d'un objet qui n'est pas obscurci et dans sa position normale, la souris et l'IA s'en sortent bien. Ensuite, l’IA n’a plus qu’à utiliser sa première couche.
Mais lorsque l’objet est tourné ou redimensionné, le CNN a besoin de plus de couches et de ressources pour fonctionner correctement. Pendant ce temps, les souris peuvent toujours reconnaître systématiquement des objets, même lorsque l’objet est partiellement obscurci, ce avec quoi l’IA a du mal.
Les chercheurs ont conclu que la vision de la souris semble être plus flexible et adaptative que le système de reconnaissance visuelle de l’IA.
L’étude de la vision de la souris rappelle que les modèles d’IA puissants sont certes impressionnants dans certaines tâches spécifiques, mais ils ne sont pas pour autant sans limites.
À la fin de l’année dernière, le PDG d’OpenAI, Sam Altman, a publié un article affirmant que le monde pourrait atteindre la superintelligence en « quelques milliers de jours ». Le milliardaire Elon Musk a également déclaré qu’une IA super-intelligente pourrait apparaître en 2025.
Mais que signifient réellement ces étapes importantes ? Il est vrai que les grands modèles d’IA linguistique ont surpassé certains humains lors des examens standardisés de médecine et de droit. Cependant, l’IA n’est pas encore en mesure d’établir des diagnostics médicaux formels sans la supervision d’un médecin, et les avocats utilisant des documents générés par l’IA ont été condamnés à une amende pour avoir contenu de fausses informations.
De plus, les systèmes d’IA avancés déployés dans les robots bipèdes ont souvent des problèmes d’équilibre. Et comme le montre la recherche du SISSA, l’IA ne semble toujours pas capable d’atteindre le même niveau d’acuité visuelle que les souris. En d’autres termes, l’IA a encore beaucoup à apprendre, tant des humains que des animaux.
Source : https://tuoitre.vn/ai-thua-chuot-khi-nhan-dien-vat-the-bi-che-khuat-2025020307425984.htm
Comment (0)