Un nouvel outil, baptisé INFOGAP, a été développé pour débusquer les biais décelables dans le contenu multilingue de Wikipedia. Ce dispositif repose sur des techniques avancées d’intelligence artificielle, permettant d’analyser en profondeur la manière dont les biographies de personnalités, notamment celles issues de la communauté LGBT, sont présentées dans différentes langues, telles que l’anglais, le russe et le français. Les résultats de cette analyse mettent en lumière des incohérences notables et témoignent de l’influence des attitudes culturelles sur l’information partagée, soulignant ainsi l’importance de cet outil pour une analyse équitable des informations en ligne.
Une équipe de chercheurs a développé un nouvel outil, INFOGAP, qui utilise l’intelligence artificielle pour analyser et mettre en lumière les biais culturels et sociaux présents dans le contenu multilingue de Wikipedia. Cette technologie a été particulièrement utilisée pour comparer la manière dont les informations biographiques sur les personnes LGBT sont présentées dans différentes versions linguistiques de l’encyclopédie en ligne, et elle a mis en évidence d’importantes disparités dans la représentation de ces sujets.
Analyse des biais sur Wikipedia
INFOGAP permet d’identifier les alignements de faits dans les biographies de Wikipedia selon diverses langues, en comparant des articles similaires. Par exemple, il peut déterminer si un fait, comme la date de naissance d’une personnalité, est commun à plusieurs versions d’un article ou s’il est unique à une version particulière. Cela ouvre la porte à une analyse plus approfondie des écarts d’information et des préférences rédactionnelles des contributeurs.
Cette capacité à détecter des informations communes et spécifiques illustre comment les attitudes culturelles peuvent influencer les contenus, soulignant ainsi la nécessité de stratégies visant à repérer et à corriger ces biais afin d’assurer un partage de connaissances plus équitable.
Les résultats de l’étude
Les chercheurs ont examiné en détail la manière dont les biographies de personnes LGBT apparaissent dans les versions anglaise, russe et française de Wikipedia. L’analyse a révélé que la version russe omettait jusqu’à 77% des contenus présents dans les versions anglaises. Ce résultat soulève des questions importantes sur la manière dont les contenus sont rédigés et perçus dans différentes cultures.
En outre, les entrées concernant les individus LGBT ont montré une tendance à exposer des éléments négatifs de manière plus marquée que les biographies de personnalités non-LGBT. Cette disproportion a conduit les chercheurs à conclure qu’il existe une partie significative de biais dans la manière dont ces sujets sont abordés sur Wikipedia.
L’importance de l’outil INFOGAP
INFOGAP représente une avancée majeure dans l’analyse des contenus multilingues. Contrairement aux méthodes conventionnelles qui reposent souvent sur des mesures simples, telles que la longueur du texte ou le ton général, cet outil propose une approche plus nuancée. En faisant correspondre les faits des articles écrits dans différentes langues, il permet d’examiner attentivement les différences de présentation et le ton utilisé, même dans le traitement de grandes quantités de données.
Lors de sa démonstration, l’outil a utilisé le LGBTBIOCORPUS, une base de données contenant plus de 2 700 biographies. Grâce à cette vaste collection, il a été possible de détecter des variations marquées dans la représentation et les détails fournis, notamment une diminution de l’accent mis sur des informations positives pour les figures LGBT dans la version russe.
Applications pratiques et implications
Les implications de l’outil INFOGAP ne se limitent pas à Wikipedia. Les chercheurs estiment qu’il peut également servir à analyser la manière dont diverses régions ou langues traitent un même sujet dans les médias ou d’autres formats d’information. Cela pourrait s’avérer particulièrement utile pour les éducateurs et les décideurs souhaitant identifier et résoudre des biais dans des ressources largement utilisées, favorisant ainsi un accès équilibré à l’information.
En fournissant des solutions pour palier les informations manquantes, cet outil peut offrir aux éditeurs une feuille de route claire pour les mises à jour nécessaires, en mettant en évidence notamment les éléments positifs qui pourraient faire défaut dans certaines versions linguistiques de Wikipedia.
En définitive, INFOGAP constitue une avancée prometteuse pour réduire les biais systémiques dans le contenu d’encyclopédies collaboratives, et pourrait devenir un outil indispensable pour tous ceux qui s’emploient à garantir une représentation équitable dans le domaine de la connaissance partagée. Les chercheurs, tels que ceux de l’Université de British Columbia et de l’Université de Washington, soulignent que ce type d’analyses peut également être appliqué à d’autres formes de contenus médiatiques, à la politique et aux narratifs culturels.
EN BREF
|