Des chercheurs parviennent à créer des reconstructions 3D plus précises en n’utilisant que deux perspectives de caméra

découvrez comment des chercheurs parviennent à créer des reconstructions 3d plus précises en n'utilisant que deux perspectives de caméra.

Dans le domaine de la reconstruction 3D, une avancée significative a récemment été réalisée par des chercheurs. Ces derniers ont réussi à créer des modèles tridimensionnels plus précis en se contentant de seulement deux perspectives de caméra. Cette prouesse ouvre de nouvelles perspectives passionnantes dans le domaine de la vision par ordinateur et de la modélisation d’environnements en trois dimensions.

Ces dernières années, les méthodes neuronales ont connu une adoption massive dans les reconstructions basées sur des caméras. Néanmoins, la plupart de ces techniques nécessitent des centaines de perspectives de caméra pour fonctionner efficacement. D’un autre côté, les méthodes photométriques traditionnelles peuvent fournir des reconstructions très précises même sur des objets ayant des surfaces sans texture, mais elles sont généralement limitées à des conditions de laboratoire contrôlées.

Une combinaison innovante de techniques

Daniel Cremers, professeur de vision par ordinateur et d’intelligence artificielle à l’Université technique de Munich (TUM), et son équipe ont mis au point une méthode qui utilise ces deux approches. Leur technique combine un réseau neuronal pour capter la surface de l’objet avec un modèle précis du processus d’éclairage. Ce modèle prend en compte l’absorption de la lumière et la distance entre l’objet et la source de lumière.

La luminosité des images est utilisée pour déterminer l’angle et la distance de la surface par rapport à la source de lumière. Cela permet de modéliser les objets avec une précision bien supérieure aux processus existants, en utilisant les environnements naturels tout en pouvant reconstruire des objets relativement sans texture.

Applications dans la conduite autonome et la préservation des monuments historiques

Cette méthode peut être utilisée pour la préservation des monuments historiques ou la numérisation des expositions de musée. Si ces objets sont détruits ou se détériorent au fil du temps, les images photographiques peuvent être employées pour reconstruire les originaux et créer des répliques authentiques.

L’équipe du Prof. Cremers développe également des méthodes de reconstruction basées sur des caméras neuronales pour la conduite autonome, où une caméra filme les environs du véhicule. La voiture autonome peut modéliser son environnement en temps réel, développer une représentation tridimensionnelle de la scène, et utiliser cette information pour prendre des décisions de conduite.

Un modèle innovant de point-cloud en temps réel

Ce processus est basé sur des réseaux neuronaux qui prédisent des nuages de points 3D pour chaque image vidéo individuelle, lesquelles sont ensuite fusionnées en un modèle à grande échelle des routes parcourues.

Leur travail a été publié sur le serveur de prépublication arXiv et sera présenté à la Conférence sur la vision par ordinateur et la reconnaissance de formes (CVPR) 2024 à Seattle, du 17 au 21 juin 2024.

Informations et crédits

Mohammed Brahimi et al, « Sparse Views, Near Light: A Practical Paradigm for Uncalibrated Point-light Photometric Stereo », arXiv (2024). DOI: 10.48550/arxiv.2404.00098

Informations complémentaires :
arXiv

Citation :

Researchers create more precise 3D reconstructions using only two camera perspectives (2024, June 20). Retrieved 20 June 2024 from https://techxplore.com/news/2024-06-precise-3d-reconstructions-camera-perspectives.html

Ce document est sujet à copyright. À l’exception de l’utilisation équitable pour des études privées ou de la recherche, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif seulement.

Liste des applications

ApplicationsExemples
Préservation des monuments historiques 🏛️Numérisation d’expositions de musée, restauration de monuments
Conduite autonome 🚗Modélisation en temps réel des environnements de conduite, prise de décision