Cet été, un nouveau modèle de langage open source sera lancé, mettant en avant des caractéristiques de soutien multilingue et de transparence publique. Développé par des chercheurs de l’EPFL et de l’ETH Zurich, en collaboration avec d’autres institutions académiques, ce modèle a été entraîné sur le superordinateur Alps, offrant ainsi une alternative crédible aux systèmes commerciaux. Destiné à répondre à des enjeux variés dans les domaines du science, gouvernement, éducation et secteur privé, ce modèle vise à promouvoir l’innovation et la responsabilité par une approche totalement ouverte.
Un nouveau modèle de langage open source, développé par l’EPFL et l’ETH Zurich, est en passe de révolutionner le domaine de l’intelligence artificielle grâce à son soutien multilingue et sa transparence publique. Ce modèle, qui sera lancé bientôt, a été conçu pour répondre aux besoins croissants d’applications IA accessibles et fiables, tout en respectant les normes éthiques et de protection des données. À travers des collaborations avec des institutions et des ingénieurs, ce projet promet de redéfinir le paysage des modèles de langage.
Un modèle de langage open source
Le nouveau modèle de langage est le fruit d’un effort collectif de chercheurs de plusieurs universités suisses, opérant en partenariat étroit avec les ingénieurs du Swiss National Supercomputing Center (CSCS). Sa nature open source signifie que le code source ainsi que les poids du modèle seront disponibles au public, permettant à tout le monde de l’utiliser, de l’adapter et de s’en servir pour une variété d’applications. Cette approche se démarque des modèles commerciaux, souvent développés dans la confidentialité, offrant ainsi une alternative crédible dans le monde de l’IA.
Soutien multilingue
Une des caractéristiques les plus notables de ce modèle est sa multilinguisme, capable de traiter plus de 1 000 langues. Avec des données d’entraînement provenant de plus de 1 500 langues, ainsi qu’une balance d’environ 60% pour l’anglais et 40% pour d’autres langues, ce modèle vise à garantir une performance exceptionnelle pour un large éventail d’utilisateurs. Le fait de s’appuyer sur un ensemble de données diversifiée permet à ce modèle de conserver une pertinence et une adaptabilité globales.
Transparence et accessibilité
La transparence est un pilier fondamental de ce projet. En rendant publique la méthodologie d’entraînement et les données utilisées, le modèle promeut une responsabilité et une fiabilité accrues dans l’utilisation de l’IA. Les réglementations européennes, telles que l’UE AI Act, influencent également le développement de ce modèle pour s’assurer qu’il répond aux exigences de conformité. La conception du projet tient compte des lois suisses sur la protection des données afin d’optimiser la confiance des utilisateurs.
Technologie du superordinateur Alps
Le modèle a été entraîné sur le superordinateur Alps, qui représente l’une des plateformes d’IA les plus avancées au monde. Équipé de plus de 10 000 NVIDIA Grace Hopper Superchips, Alps a permis d’entraîner le modèle de manière efficace et durable, en utilisant une électricité entièrement carboneutre. Cette avancée technique souligne l’importance de l’innovation dans le domaine de l’IA, tout en favorisant des méthodes durables de développement technologique.
Impact sur le développement de l’IA
Le lancement de ce nouveau modèle de langage est susceptible d’avoir un impact considérable sur un large éventail de secteurs, y compris la science, l’enseignement et le secteur public. La possibilité de disposer d’un modèle accessible et modifiable augmente les chances d’innovation et d’utilisation des compétences par des groupes variés de chercheurs et de praticiens. En réduisant la dépendance aux systèmes développés en circuit fermé, cette initiative pave la voie à un écosystème d’IA plus collaboratif et inclusif.
Les développements actuels autour de ce modèle de langage open source posent des questions intéressantes sur l’avenir de l’intelligence artificielle. En tant que modèle promouvant la transparence et le soutien multilingue, il sera fascinant de suivre son adoption et son utilisation à l’échelle mondiale.
EN BREF
|