IA générative et art
L’intelligence artificielle générative
H3760 v2 Article de référence

IA générative et art
L’intelligence artificielle générative

Auteur(s) : Jean-Paul HATON

Date de publication : 10 avr. 2024

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Sommaire

Présentation

RÉSUMÉ

L’intelligence générative est une branche de l’intelligence artificielle (IA) qui tend à fournir une production (texte, image, vidéo, musique) à partir d’un court texte descriptif (appelé prompt). Les modèles de base de tels systèmes sont des réseaux neuronaux profonds dont l’apprentissage nécessite des quantités très importantes de données de différents types selon la production désirée. Les performances obtenues par ces systèmes (tels ChatGPT pour la production de textes) atteignent des niveaux jusqu’à présent inégalés.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Jean-Paul HATON : Professeur émérite - LORIA – Université de Lorraine

INTRODUCTION

L’intelligence artificielle (IA) est née au cours des années 1950, sous l’impulsion de pionniers notamment John McCarthy, Marvin Minsky, Claude Shannon. Son but est d’implanter sur ordinateur des systèmes simulant des fonctions réputées intelligentes : reconnaissance de la parole et des images, raisonnement, prise de décision, etc.

De tels systèmes se fondent sur différents types de modèles, en particulier les réseaux neuronaux, ou neuromimétiques, qui tirent leur inspiration du modèle cortical humain ou animal : un ensemble d’unités très simples (les « neurones ») en très grand nombre et fortement interconnectés. Un avantage majeur est leur capacité d’apprentissage à partir d’exemples. Vers 2010, des résultats spectaculaires dans de nombreux domaines (jeu de go, interprétation d’images, reconnaissance de la parole, traitement de la langue naturelle écrite, diagnostic) ont mis en lumière un type particulier de ces modèles : les réseaux neuronaux profonds (Deep Neural Networks).

La caractéristique de tels modèles est d’être formés d’un nombre important de couches de neurones pouvant atteindre plusieurs centaines. L’apprentissage profond de ces modèles nécessitent à la fois trois conditions :

  • des algorithmes performants (amélioration de la rétropropagation du gradient d’erreur) ;

  • des moyens de calcul parfois considérables (processeur spécialisés tels que ceux de la firme Nvidia) ;

  • la disponibilité de quantités importantes de données d’apprentissage, notamment les big data, ces données numériques que nous produisons tous quotidiennement de façon massive (messages vocaux et écrits, signaux GPS, informations climatiques, achats, transactions bancaires, publications scientifiques, journaux et revues, etc.)

Parmi ces réseaux neuronaux profonds, un modèle s’est révélé particulièrement performants. Il s’agit des réseaux convolutifs, conçus initialement pour l’image et étendu ensuite à de nombreux domaines d’application.

L’IA générative utilise les réseaux neuronaux profonds pour produire à la demande un texte, une image, une vidéo, une musique, etc. Cette production résulte d’une courte description textuelle appelée prompt. Cet article présente les différents types de modèles d’IA générative et décrit leur fonctionnement. Les domaines de l’écrit (notamment ChatGPT) et de l’image (tel que MidJourney) sont particulièrement considérés.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


4. IA générative et art

  • Le domaine des arts (peinture, sculpture, photographie, musique, cinéma) est largement investi par l’IA générative. Le principe demeure le même ; à partir d’une base d’apprentissage de grande taille composée d’œuvres d’artistes humains, il s’agit de fournir une production conforme au prompt proposé. De nombreux systèmes sont proposés aux artistes, voire au grand public.

    Dans le domaine de l’image, on peut citer les systèmes Stable Diffusion, MidJourney, Dall-E, Imagen ou Lensa. La qualité des productions de tels systèmes est étonnante. Prenons deux exemples parmi beaucoup d’autres :

    • en 2018, le tableau « Portrait d’Edmond de Bellamy », créé par un système de réseaux antagonistes (§ 3.2) fut adjugé 432 500 $ ;

    • en 2022, le Mauritshuis Museum de La Haye, propriétaire de « La Jeune fille à la perle » de Vermeer, a proposé aux artistes d’exposer leurs variations autour de ce tableau pendant que celui-ci était prêté à un autre musée. Parmi plus de trois mille œuvres proposées, le choix s’est porté sur un tableau créé par un artiste qui a utilisé les logiciels Midjourney et Photoshop (figure 5).

    En musique, l’IA offre aux artistes de nouvelles possibilités à la création : nouveaux timbres et sonorités, contrôles musicaux inédits, procédés de composition. Un grand nombre de logiciels de composition musicale, souvent open source, existent sur le marché tels que Boomy, AI Music, AIVA, Soundraw, Ecrett Music, MuseNet (d’OpenAI), Amadeus Code, MusicLM (de Google), MusicGen (de Meta). Ces outils peuvent être des aides remarquables pour les compositeurs humains.

    On peut également citer le domaine de la vidéo (bientôt sans doute le cinéma),...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
IA générative et art

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - LE CUN (Y.) -   Quand la machine apprend, la révolution des réseaux de neurones et l’apprentissage profond –  -  Odile Jacob (2021).

  • (2) - HATON (J.-P.) et al -   Intelligences artificielles : de la théorie à la pratique –  -  Dunod (2023).

  • (3) - GOODFELLOW (I.) et al -   Generative Adversarial Networks.  -  Advances in Neural Information Processing Systems, 27 (2014).

  • (4) - SOHL-DICKSTEIN (J.) et al -   Deep unsupervised learning using non equilibrium thermodynamics.  -  Proc. 32nd Int. Conf. on Machine Learning, Lille, France (2015).

  • (5) - RAMESH (A.) et al -   Hierarchical Text-Conditional Image Generation with CLIP Latents.  -  (2022) arXiv.org: 2204.06125.

  • (6) - NICHOL (A.) et al -   Point·E: A System for...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Reconnaissance des formes

Discipline à la fois ancienne de par son histoire et très jeune de par ses multiples évolutions au cours ...

Architecture des ordinateurs : CPU et coprocesseurs/accélérateurs

Les différents coprocesseurs/accélérateurs utilisés pour accélérer l'exécution des programmes dans ...

Systèmes multi-agents

Les systèmes multi-agentsconstituent une discipline issue del’Intelligence Artificielle Distribuée. ...

Microprocesseurs - Approche générale

Les microprocesseurs sont au cœur des systèmes numériques. Ils permettent le développement de logiciels ...