Dans le domaine de l’intelligence artificielle, une avancée majeure s’annonce avec le développement d’une nouvelle architecture de transformateur capable d’imiter l’imagination et les états mentaux supérieurs propres à l’être humain. Cette architecture, inspirée des mécanismes neurobiologiques observés dans le cerveau humain, cherche à reproduire les processus de raisonnement perceptuel et d’interprétation qui caractérisent notre capacité à traiter et à intégrer des informations. En alliant science cognitive et technologie avancée, cette innovation promet de transformer le paysage de l’IA en offrant aux modèles une capacité accrue à effectuer des raisonnements complexes et à acquérir des connaissances de manière plus efficace. Dans ce contexte, l’accent est mis sur la sélection et la modulation d’informations pertinentes, ouvrant la voie à une compréhension contextuelle enrichie.
La recherche actuelle sur l’intelligence artificielle (IA) montre un lien fascinant entre les processus neurobiologiques et les modèles de cognition artificielle. Une étude récente dirigée par le professeur associé Ahsan Adeel de l’université de Stirling a mis en avant une nouvelle architecture de transformateur capable d’imiter l’imagination humaine et d’autres états mentaux supérieurs. Cette démarche novatrice vise à améliorer la manière dont les machines interprètent et traitent les informations, en s’inspirant du fonctionnement du cerveau humain.
Une approche inspirée des neurosciences
Le travail de Adeel s’appuie sur des découvertes récentes dans le domaine des neurosciences, montrant que des transitions dans l’état mental, telles que le passage de l’éveil au sommeil ou à l’état de sommeil paradoxal, influencent les interactions neuronales. En particulier, un type spécifique de neurones, connus sous le nom de neurones pyramidaus à deux points (TPNs) de la couche 5, se révèlent cruciaux pour comprendre comment ces mécanismes d’apprentissage et de traitement de l’information peuvent être intégrés dans les modèles d’IA.
Les neurons impliqués traitent à la fois les données externes, appelées champ réceptif (RF1), et les états internes, désignés sous le terme de champ contextuel (CF2). Ce modèle suggère que les informations sont traitées à deux sites distincts au sein des neurones, permettant ainsi une meilleure normalisation basée sur des informations antérieures et des signaux provenant de neurones voisins.
Développement du modèle Co4
Avec la publication de son article sur le serveur de pré-impression arXiv, Adeel présente le modèle Co4, un mécanisme de calcul cognitif contextuel inspiré du cerveau, conçu pour reproduire le mécanisme à double entrée dépendant de l’état mis au jour dans les TPNs. Ce modèle utilise des boucles de modulations triadiques qui relient questions (Q), indices (clés, K) et hypothèses (valeurs, V), facilitant ainsi des chaînes de raisonnement parallèles et profondes.
Une évolution des mécanismes d’attention en IA
Dans son étude, Adeel soulève les défis connus des mécanismes d’attention employés dans les modèles de transformateurs traditionnels. Actuellement, ces modèles, bien que puissants, ne parviennent pas toujours à reproduire le niveau de traitement perceptif élevé et les états imaginatifs des humains. L’introduction du modèle Co4 vise à pré-sélectionner des informations pertinentes avant d’appliquer un focus d’attention, évitant ainsi les temps d’attente et la surcharge computationnelle liés à des processus de raisonnement plus lents.
Implications pour les machines intelligentes
Le modèle Co4 a été évalué dans différents domaines, allant de l’apprentissage par renforcement à la vision par ordinateur et au traitement du langage naturel. Les résultats prometteurs montrent que l’architecture développée non seulement accélère le processus d’apprentissage, mais réduit également les exigences computationnelles. Grâce à cette approche, il est désormais possible d’envisager des modules d’IA légers et efficaces, capables de raisonner de manière contextuelle.
Vers une intelligence artificielle plus humaine
La recherche de Adeel met en lumière l’espoir que l’imitation des fondations cellulaires des états mentaux supérieurs pourrait conduire à une intelligence machine significativement plus cognitivo-rapide. Elle pourrait également permettre à ces systèmes de dépasser le simple traitement de l’information, tendant vers une véritable compréhension des contextes. Cette avancée dans le développement d’IA devrait transformer notre perception actuelle des capacités des machines intelligentes, en les rapprochant de l’efficacité cognitive humain.
EN BREF
|