Contactez-nous
Comprendre la génération de contenus
Comprendre le fonctionnement des IA génératives
FIC1859 v1 Fiche pratique

Comprendre la génération de contenus
Comprendre le fonctionnement des IA génératives

Auteur(s) : Véronique MESGUICH

Date de publication : 10 oct. 2024 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Distinguer les formes d’apprentissages

2 - Comprendre la génération de contenus

3 - Comprendre l’optimisation des modèles de langage

  • 3.1 - Le « fine tuning »
  • 3.2 - L’Apprentissage par renforcement

4 - Notre conseil

  • 4.1 - Utilisez des modèles open source pour mieux comprendre le fonctionnement

5 - Erreurs à éviter

  • 5.1 - Ne croyez pas que les modèles de langage « comprennent » véritablement le langage de manière humaine
Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Les intelligences artificielles génératives (IA génératives) telles que ChatGPT révolutionnent de nombreux secteurs, notamment dans le domaine de la création de contenus, de la recherche d’information et de la veille. Comprendre leur fonctionnement est essentiel pour appréhender leur potentiel et leurs limites.

Cette fiche détaille le fonctionnement des IA génératives en trois étapes, décrivant les processus d’entraînement, de génération de contenus et d’optimisation.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1859

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

2. Comprendre la génération de contenus

Une fois qu’un modèle est entraîné, il peut être utilisé pour générer du contenu. Ce processus est appelé inférence. Le modèle utilise les connaissances acquises durant la formation pour créer de nouvelles données, que ce soit du texte, des images, de la musique, ou des vidéos. Prenons l’exemple d’un modèle de langage comme GPT et tentons de décomposer le processus de génération de contenus.

Au départ, l’utilisateur fournit une entrée sous forme de prompt : ce prompt peut être une question ou une instruction. Ce texte va être encodé, c’est-à-dire divisé par le modèle en unités (tokens) correspondant à des mots ou groupe de mots. Les tokens sont ensuite transformés en vecteurs mathématiques (représentations numériques) grâce à la technologie des transformeurs évoquée plus haut.

La génération de la réponse s’effectue sous forme de décodage à partir de diverses méthodes probabilistes. Le modèle génère la réponse mot par mot (ou token par token), de façon itérative, en prédisant à chaque étape le token le plus probable suivant. Chaque mot dans la phrase générée est fonction du choix des mots précédents, en se basant sur la connaissance du langage que le modèle a acquise lors de la phase d’entraînement.

Afin d’éviter les répétitions ou les choix trop évidents, le modèle inclut des formes de variabilité. Plusieurs paramètres peuvent être ajustés pour moduler la qualité et la diversité des résultats. La température, notamment, est une formule mathématique associée aux modèles de génération probabiliste et qui contrôle le degré de créativité du modèle. Une température basse privilégie des sorties prévisibles et cohérentes, tandis qu’une température élevée favorise l’originalité.

Prenons l’exemple d’une question simple du type « Quelle est la capitale de la France ? » Le modèle de langage a été entraîné à reconnaître que « capitale » est souvent suivi d’un nom de ville. Il va donc chercher dans ses données d’entraînement les villes associées à la France et proposer « Paris » comme réponse la plus probable.

Ce caractère aléatoire de la gestion de contenus...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Comprendre la génération de contenus

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre