Représentation des données en 3D
Apprentissage profond pour les images tridimensionnelles
RE186 v1 RECHERCHE ET INNOVATION

Représentation des données en 3D
Apprentissage profond pour les images tridimensionnelles

Auteur(s) : Petr DOKLADAL, Étienne DECENCIÈRE

Date de publication : 10 sept. 2023

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Représentation des données en 3D

2 - Notions de base de l’apprentissage profond pour l’analyse d’images

3 - Analyse d’images 3D

4 - Génération de données 3D

5 - Défis, perspectives et conclusion

6 - Aspects environnementaux

7 - Glossaire

8 - Sigles, notations et symboles

Sommaire

Présentation

RÉSUMÉ

L’apprentissage profond a provoqué une révolution technologique dans l’analyse et la génération d’images à deux dimensions, permettant le développement de nouvelles applications. Dans cet article, il est question de l’application de ces méthodes aux données tridimensionnelles, comme les tomographies utilisées en imagerie médicale ou dans l’étude de matériaux. L’analyse de données 3D, mais aussi leur génération, sont abordées. Les difficultés théoriques et pratiques de ces approches sont expliquées et leurs perspectives développées.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Petr DOKLADAL : Maître de recherche - Mines Paris – Université PSL, Centre de Morphologie mathématique, Fontainebleau, France

  • Étienne DECENCIÈRE : Directeur de recherche - Mines Paris – Université PSL, Centre de Morphologie mathématique, Fontainebleau, France

INTRODUCTION

L’apprentissage profond (deep learning, en anglais) est une discipline qui fait appel aux réseaux de neurones artificiels pour apprendre automatiquement des transformations. Depuis une dizaine d’années, cette discipline a bouleversé différents domaines des sciences des données, comme l’analyse d’images ou le traitement du langage naturel, au point de provoquer un renouveau de l’intelligence artificielle (IA). Cette révolution technologique a poussé des grandes sociétés à recruter à prix d’or des chercheurs et des ingénieurs pour constituer ou renforcer des équipes en IA. De nombreuses start-ups ont aussi été créées pour développer des solutions à des problèmes qui étaient considérés, il y a seulement quelques années, comme hors de portée.

Les images tridimensionnelles (3D) occupent aussi une place croissante dans les applications industrielles, grâce aux progrès de méthodes d’acquisition de plus en plus performantes, comme la tomodensitométrie par rayons X, l’imagerie par résonance magnétique ou la télédétection par laser (plus communément connue sous l'appellation LiDAR, de l’anglais Light Detection And Ranging). Notons qu’un autre domaine de recherche porte sur l’extraction d’informations 3D à partir d’images 2D.

C’est donc naturellement que des applications de l’apprentissage profond pour les images 3D ont été développées ces dernières années. Cet article a pour objectif de présenter de façon synthétique et accessible ces méthodes. Pour cela, nous commençons par introduire les différentes représentations 3D considérées : nous nous limitons ici aux représentations sous forme de tableau à trois dimensions ou de graphe. Nous présentons ensuite brièvement les bases de l’apprentissage profond pour les images et les graphes, puis nous expliquons comment elles sont appliquées aux images 3D. Nous abordons dans la section suivante un sujet plus prospectif : la génération d’images 3D. Enfin, avant de conclure, nous discutons des perspectives et des défis de ces méthodes.

Nota

le lecteur trouvera en fin d’article un glossaire des termes et expressions importants de l’article, ainsi qu’un tableau des sigles, notations et symboles utilisés tout au long de l’article.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re186

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil Ressources documentaires Électronique - Photonique Technologies radars et applications Sonars et Lidars Apprentissage profond pour les images tridimensionnelles Représentation des données en 3D

Accueil Ressources documentaires Technologies de l'information Technologies radars et applications Sonars et Lidars Apprentissage profond pour les images tridimensionnelles Représentation des données en 3D

Accueil Ressources documentaires Innovation Innovations technologiques Innovations en électronique et TIC Apprentissage profond pour les images tridimensionnelles Représentation des données en 3D

Accueil Ressources documentaires Technologies de l'information Le traitement du signal et ses applications Traitement du signal : bases théoriques Apprentissage profond pour les images tridimensionnelles Représentation des données en 3D

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

1. Représentation des données en 3D

Alors que les images sont classiquement représentées comme des matrices 2D (avec éventuellement des valeurs vectorielles, comme pour la couleur), diverses représentations existent pour les données 3D : matrice à trois dimensions, carte de profondeur, nuage de points ou maillage. Les lecteurs intéressés par les nuages de points pourront se référer à l’article de Marcotegui et Serna [RE 187]. Nous ne les traiterons pas ici.

La matrice à trois dimensions est une extension directe de la représentation classique des images 2D. Tout comme un pixel, un voxel est un volume élémentaire dans un espace 3D qui contient certaines informations. La grille de voxels est utilisée pour les images 3D de corps pleins. On en trouve des exemples en médecine ou analyse des matériaux.

Les nuages de points sont des ensembles de points répartis dans un espace 3D. Contrairement aux grilles de voxels, les points d’un nuage ont une position arbitraire, définie par un ensemble de coordonnées. Dans les nuages de points, il n’y a pas de discrétisation. De même, la représentation en nuage de points n’a pas de connexions locales entre les points, ce qui conduit à un très grand degré de liberté et haute dimensionnalité.

Les maillages sont des collections de points sur lesquels des relations de lien sont définies. Contrairement aux points dans les nuages de points, les points dans les maillages sont appelés « nœuds », « vertex » ou « sommets ». Les liens sont de dimensionnalités différentes. Les plus simples sont les segments de droite (arêtes) pour représenter les arêtes des solides. Les surfaces sont représentées par des triangles (maillage triangulaire), quadrilatère (quad mesh) ou plus généralement par des polygones convexes de taille variable (communément appelées « n-gon mesh »). Notons que les n-gons ne définissent pas de manière unique une surface 3D lorsque n est supérieur à 3, sauf si les sommets appartiennent à un plan.

Les volumes sont maillés...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Représentation des données en 3D

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - ROSENBLATT (F.) -   The perceptron : A probabilistic model for information storage and organization in the brain.  -  Psychol. Rev., vol. 65, n° 6, p. 386-408, DOI : 10.1037/h0042519 (1958).

  • (2) - AZENCOTT (C.-A.) -   Introduction au machine learning.  -  Dunod (2019).

  • (3) - CHOLLET (F.) -   Deep Learning with Python.  -  Second Edition, Simon and Schuster (2021).

  • (4) - LECUN (Y.), BENGIO (Y.), HINTON (G.) -   Deep learning.  -  Nature, vol. 521, n° 7553, p. 436-444 (2015).

  • (5) - CYBENKO (G.) -   Approximations by superpositions of a sigmoidal function.  -  Math. Control Signals Syst., vol. 2, p. 183-192 (1989).

  • (6) - FUKUSHIMA (K.) -   Neocognitron : A self-organizing neural network model for a mechanism of pattern...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Développement logiciel en traitement d'images médicales - Bonnes pratiques et méthodologie

Cet article a pour but d'aider l'ingénieur ou le chercheur à progresser dans la mise au point de ...

Microscopie électronique à balayage - Images, applications et développements

La microscopie électronique à balayage est un outil puissant d'observation des surfaces. Les ...

Microscopie à sonde locale

Cet article traite de la microscopie en champ proche ou à sonde locale. Ce type de microscopie est basé ...