Défis, perspectives et conclusion
Apprentissage profond pour les images tridimensionnelles

RE186 v1 RECHERCHE ET INNOVATION

Défis, perspectives et conclusion
Apprentissage profond pour les images tridimensionnelles

Auteur(s) : Petr DOKLADAL, Étienne DECENCIÈRE

Date de publication : 10 sept. 2023 | Read in English

Cet article est réservé aux abonnés

Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?Se connecter

Sommaire
Médias

Présentation

1 - Représentation des données en 3D

2 - Notions de base de l’apprentissage profond pour l’analyse d’images

2.1 - Réseaux de neurones artificiels et apprentissage profond
2.2 - Apprentissage profond pour les images
2.3 - Réseaux convolutifs sur graphes

3 - Analyse d’images 3D

4 - Génération de données 3D

4.1 - Espace de représentation des formes 3D
4.2 - Reconstruction de formes 3D à partir d’image
4.3 - Reconstruction tomographique et génération d’images 3D

5 - Défis, perspectives et conclusion

6 - Aspects environnementaux

7 - Glossaire

8 - Sigles, notations et symboles

RÉSUMÉ

L’apprentissage profond a provoqué une révolution technologique dans l’analyse et la génération d’images à deux dimensions, permettant le développement de nouvelles applications. Dans cet article, il est question de l’application de ces méthodes aux données tridimensionnelles, comme les tomographies utilisées en imagerie médicale ou dans l’étude de matériaux. L’analyse de données 3D, mais aussi leur génération, sont abordées. Les difficultés théoriques et pratiques de ces approches sont expliquées et leurs perspectives développées.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Petr DOKLADAL : Maître de recherche - Mines Paris – Université PSL, Centre de Morphologie mathématique, Fontainebleau, France
Étienne DECENCIÈRE : Directeur de recherche - Mines Paris – Université PSL, Centre de Morphologie mathématique, Fontainebleau, France

INTRODUCTION

L’apprentissage profond (deep learning, en anglais) est une discipline qui fait appel aux réseaux de neurones artificiels pour apprendre automatiquement des transformations. Depuis une dizaine d’années, cette discipline a bouleversé différents domaines des sciences des données, comme l’analyse d’images ou le traitement du langage naturel, au point de provoquer un renouveau de l’intelligence artificielle (IA). Cette révolution technologique a poussé des grandes sociétés à recruter à prix d’or des chercheurs et des ingénieurs pour constituer ou renforcer des équipes en IA. De nombreuses start-ups ont aussi été créées pour développer des solutions à des problèmes qui étaient considérés, il y a seulement quelques années, comme hors de portée.

Les images tridimensionnelles (3D) occupent aussi une place croissante dans les applications industrielles, grâce aux progrès de méthodes d’acquisition de plus en plus performantes, comme la tomodensitométrie par rayons X, l’imagerie par résonance magnétique ou la télédétection par laser (plus communément connue sous l'appellation LiDAR, de l’anglais Light Detection And Ranging). Notons qu’un autre domaine de recherche porte sur l’extraction d’informations 3D à partir d’images 2D.

C’est donc naturellement que des applications de l’apprentissage profond pour les images 3D ont été développées ces dernières années. Cet article a pour objectif de présenter de façon synthétique et accessible ces méthodes. Pour cela, nous commençons par introduire les différentes représentations 3D considérées : nous nous limitons ici aux représentations sous forme de tableau à trois dimensions ou de graphe. Nous présentons ensuite brièvement les bases de l’apprentissage profond pour les images et les graphes, puis nous expliquons comment elles sont appliquées aux images 3D. Nous abordons dans la section suivante un sujet plus prospectif : la génération d’images 3D. Enfin, avant de conclure, nous discutons des perspectives et des défis de ces méthodes.

Nota

le lecteur trouvera en fin d’article un glossaire des termes et expressions importants de l’article, ainsi qu’un tableau des sigles, notations et symboles utilisés tout au long de l’article.

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ? Se connecter

MOTS-CLÉS

apprentissage profond Maillage réseau neuronal convolutif image 3D

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re186

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil > Ressources documentaires > Innovation > Innovations technologiques > Innovations en électronique et TIC > Apprentissage profond pour les images tridimensionnelles > Défis, perspectives et conclusion

Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Intelligence artificielle : concepts et méthodes d'apprentissage > Apprentissage profond pour les images tridimensionnelles > Défis, perspectives et conclusion

Accueil > Ressources documentaires > Technologies de l'information > Technologies radars et applications > Sonars et Lidars > Apprentissage profond pour les images tridimensionnelles > Défis, perspectives et conclusion

Accueil > Ressources documentaires > Électronique - Photonique > Technologies radars et applications > Sonars et Lidars > Apprentissage profond pour les images tridimensionnelles > Défis, perspectives et conclusion

Lecture en cours
Présentation

Page
suivante

Aspects environnementaux

Article inclus dans l'offre

"Le traitement du signal et ses applications"

(161 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Défis, perspectives et conclusion

Les défis généraux de l’apprentissage profond concernent aussi l’analyse d’images 3D. Parmi ceux-ci, le principal défi est peut-être la recherche de méthodes permettant d’apprendre avec moins de données. En effet, aujourd’hui, dans les applications industrielles, la constitution des bases d’apprentissage constitue souvent le poste de dépenses principal. Ce travail regroupe la recherche de données, leur nettoyage, et surtout leur annotation. Ce défi est particulièrement important dans le cas des données 3D qui sont en général plus coûteuses à obtenir, à manipuler et à annoter. Une des pistes les plus prometteuses pour aider à relever ce défi est l’apprentissage auto-supervisé qui permet de développer des modèles sans annotation [H 5 012].

Un autre défi de taille porte sur l’optimisation des réseaux de neurones. La détermination de millions de paramètres pose des difficultés théoriques et pratiques importantes. Les méthodes actuelles permettent souvent de s’en sortir, mais on ne comprend pas toujours pourquoi elles fonctionnent aussi bien et, par conséquent, les pistes d’amélioration sont d’autant plus difficiles à trouver. Là encore, ce problème est plus aigu dans le cas des données 3D, étant donné que les modèles utilisés ont tendance à comporter davantage de paramètres.

Un troisième défi, particulièrement important dans les domaines où la sécurité joue un rôle central, est celui de l’interprétabilité de ces méthodes. On a souvent du mal à expliquer pourquoi les réseaux de neurones artificiels fonctionnent, ou ne fonctionnent pas. Dans le cas des images 3D, ce problème concerne directement les données médicales, mais aussi les applications en contrôle non destructif.

Une autre piste de recherche intéressante porte sur les données multimodales, c’est-à-dire les cas où l’on dispose de différentes mesures physiques pour le même phénomène. Par exemple, en imagerie médicale on peut disposer de plusieurs modalités : rayons X,...

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.