Dans le domaine en pleine expansion de l’analyse des médias visuels, un chercheur audacieux s’illustre en proposant une nouvelle approche en utilisant la vision machine. En cherchant à transcender les classifications traditionnelles des images, cette méthodologie novatrice se concentre sur les similarités visuelles perçues par les algorithmes plutôt que de les ranger dans des catégories figées. Au cœur de cette investigation se trouve un outil prometteur qui permet d’explorer de vastes collections visuelles, ouvrant ainsi de nouvelles perspectives sur la manière dont les images façonnent et reflètent notre culture.
Dans un contexte où l’analyse des collections visuelles est essentielle pour appréhender des événements historiques et des expressions culturelles, l’approche innovante de Tillmann Ohm, étudiant à la Tallinn University School of Digital Technologies, ouvre de nouvelles perspectives. Son travail de thèse propose d’explorer ces vastes ensembles d’images non pas en se basant sur leur contenu traditionnel, mais en utilisant des algorithmes de vision machine pour dessiner des cartes de similarité qui révèlent des motifs visuels souvent négligés.
La difficulté des collections visuelles
Les collections visuelles, qui incluent des peintures, des photographies et d’autres formes de médias, sont souvent massives et complexes. Comportant des centaines de milliers d’éléments, elles présentent des défis majeurs pour l’analyse. De par leur richesse et leur diversité, ces collections sont cruciales pour comprendre comment les sociétés utilisent les images pour façonner un sens culturel au fil du temps. Cependant, leur étude demeure difficile, tant par leur taille que par la complexité inhérente à leurs caractéristiques visuelles, leurs contenus et les structures de méta-données qui les accompagnent.
Une approche basée sur la vision machine
Dans sa thèse, Tillmann Ohm propose d’adopter une perspective basée sur la vision machine, qui s’intéresse non pas à ce qu’est une image en soi, mais à ce qu’elle évoque. Loin des catégories fixées préalablement, cette méthode permet de regrouper les images en cartes selon leur similarité visuelle telle qu’interprétée par des algorithmes. Cela donne lieu à des espaces de similarité où les distances entre les points reflètent à quel point les images se ressemblent.
Le Collection Space Navigator
Un des principaux apports de la recherche de Ohm est le Collection Space Navigator, une interface accessible via un navigateur. Cet outil permet aux chercheurs et aux conservateurs d’explorer des données de collections visuelles de manière interactive. Les cartes de similarité en deux dimensions favorisent une enquête interprétative ouverte, révélant des motifs et des relations visuelles qui sont souvent difficiles à détecter avec les méthodes traditionnelles basées sur les méta-données ou les mots-clés.
Des études de cas et des applications pratiques
Le Collection Space Navigator a déjà été appliqué à diverses collections de patrimoine culturel, intégrées dans des workflows de recherche interdisciplinaires. Un cas d’étude clé a analysé plus de 200 000 images provenant de propagandes soviétiques, permettant de mettre en lumière des motifs visuels à long terme dans le cinéma de propagande. Des regroupements d’images similaires ont mis en évidence des scènes récurrentes, comme des leaders posant devant le Mausolée de Lénine, révélant ainsi des stratégies de propagande en évolution.
Un nouvel éclairage sur la culture visuelle
La recherche de Tillmann Ohm enrichit le domaine de l’analyse des données culturelles. En remettant en question à la fois l’autorité institutionnelle et algorithmique, elle ouvre de nouvelles voies pour que les musées, les érudits et le grand public acquièrent des éclairages novateurs sur la culture visuelle. Cette démarche favorise non seulement la collaboration interdisciplinaire, mais permet également une compréhension approfondie des narrations culturelles à travers des outils computationnels innovants.
Une reconnaissance universitaire
Ohm a défendu sa thèse intitulée « Designing Processes and Tools to Research Similarity Spaces of Visual Collections » le 11 juin, sous la direction de Maximilian Günther Schich, professeur à l’Université de Tallinn. Les opposants étaient Lauren Tilton, professeur à l’Université de Richmond, et Iyad Rahwan, professeur à l’Institut Max Planck pour le Développement Humain.
EN BREF
|