Dans le monde en constante évolution de l’intelligence artificielle, une récente percée promet de révolutionner les capacités de raisonnement des grands modèles de langage. Découvrons ensemble comment cette nouvelle méthode ouvre la voie à des avancées prometteuses dans le domaine de l’IA.
Les chercheurs du MIT, en collaboration avec d’autres institutions, ont élaboré une technique révolutionnaire qui permet aux grands modèles de langage d’atteindre de nouvelles performances en matière de raisonnement. Cette approche, dénommée Programmes intégrés en langage naturel (NLEPs), propose une solution innovante pour les tâches complexes mêlant langage naturel, mathématiques et raisonnement symbolique.
Problématiques des modèles de langage actuels
Les grands modèles de langue, comme ceux derrière ChatGPT, sont remarquablement efficaces pour diverses tâches linguistiques telles que la rédaction de documents juridiques, l’analyse de sentiments ou encore la traduction multilingue. Cependant, ces modèles d’apprentissage machine éprouvent des difficultés avec les tâches requérant un raisonnement numérique ou symbolique précis.
Par exemple, bien qu’un modèle puisse mémoriser la liste des présidents américains et leurs dates de naissance, il peut échouer à répondre à une question complexe comme : « Quels présidents américains élus après 1950 sont nés un mercredi ? » (la réponse étant Jimmy Carter).
La solution des Programmes intégrés en langage naturel (NLEPs)
Pour surmonter ces limitations, les chercheurs du MIT ont développé les Programmes intégrés en langage naturel (NLEPs), une méthode qui demande aux modèles de langage de créer puis d’exécuter des programmes Python pour résoudre les requêtes des utilisateurs.
Cette méthodologie a permis aux modèles de langage de gagner en précision sur une grande variété de tâches de raisonnement. De plus, les NLEPs sont généralistes et peuvent être réutilisés pour de multiples tâches, renforçant ainsi leur efficacité.
Avantages des NLEPs
Les NLEPs offrent plusieurs avantages majeurs :
- Transparence : Les utilisateurs peuvent vérifier le programme pour comprendre comment le modèle a raisonné et rectifier les erreurs si nécessaire.
- Efficacité : Il est possible de générer un programme central pour des questions similaires, ce qui évite de relancer le modèle à chaque fois pour des variables différentes.
- Confidentialité : Les programmes étant exécutés localement, les données sensibles des utilisateurs n’ont pas besoin d’être envoyées à des entreprises tierces comme OpenAI ou Google.
Méthodologie de mise en œuvre des NLEPs
La mise en œuvre des NLEPs suit un processus en quatre étapes :
- Appeler les packages ou fonctions nécessaires pour résoudre la tâche.
- Importer les représentations en langage naturel des connaissances requises.
- Implémenter une fonction pour calculer la réponse.
- Produire le résultat en langage naturel, avec une visualisation automatique des données si besoin.
Performances des NLEPs
Les résultats montrent que les NLEPs ont obtenu plus de 90 % de précision en utilisant GPT-4 pour résoudre diverses tâches de raisonnement symbolique, telles que le suivi d’objets mélangés ou jouer au jeu de 24. En comparaison, ils ont montré une amélioration de 30 % par rapport aux méthodes de prompting spécifiques à une tâche.
Perspectives d’avenir
Les chercheurs souhaitent explorer des méthodes pour améliorer les performances des NLEPs avec des modèles de plus petite taille. Ils prévoient également d’examiner l’impact des variations de prompts afin de renforcer la robustesse des processus de raisonnement des modèles.
Liste des Avantages et Inconvénients des NLEPs
- 👍 Transparence
- 🎯 Précision accrue
- 🔒 Confidentialité des données
- 📉 Mémoire des petits modèles
- 💼 Coût de mise en œuvre
- 🛠 Dépendance au Python