Présentation

Article

1 - DISTINGUER LES FORMES D’APPRENTISSAGES

2 - COMPRENDRE LA GÉNÉRATION DE CONTENUS

3 - COMPRENDRE L’OPTIMISATION DES MODÈLES DE LANGAGE

  • 3.1 - Le « fine tuning »
  • 3.2 - L’Apprentissage par renforcement

4 - NOTRE CONSEIL

  • 4.1 - Utilisez des modèles open source pour mieux comprendre le fonctionnement

5 - ERREURS À ÉVITER

  • 5.1 - Ne croyez pas que les modèles de langage « comprennent » véritablement le langage de manière humaine

Fiche pratique | Réf : FIC1859 v1

Comprendre la génération de contenus
Comprendre le fonctionnement des IA génératives

Auteur(s) : Véronique MESGUICH

Date de publication : 10 oct. 2024 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Les intelligences artificielles génératives (IA génératives) telles que ChatGPT révolutionnent de nombreux secteurs, notamment dans le domaine de la création de contenus, de la recherche d’information et de la veille. Comprendre leur fonctionnement est essentiel pour appréhender leur potentiel et leurs limites.

Cette fiche détaille le fonctionnement des IA génératives en trois étapes, décrivant les processus d’entraînement, de génération de contenus et d’optimisation.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1859


Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

2. Comprendre la génération de contenus

Une fois qu’un modèle est entraîné, il peut être utilisé pour générer du contenu. Ce processus est appelé inférence. Le modèle utilise les connaissances acquises durant la formation pour créer de nouvelles données, que ce soit du texte, des images, de la musique, ou des vidéos. Prenons l’exemple d’un modèle de langage comme GPT et tentons de décomposer le processus de génération de contenus.

Au départ, l’utilisateur fournit une entrée sous forme de prompt : ce prompt peut être une question ou une instruction. Ce texte va être encodé, c’est-à-dire divisé par le modèle en unités (tokens) correspondant à des mots ou groupe de mots. Les tokens sont ensuite transformés en vecteurs mathématiques (représentations numériques) grâce à la technologie des transformeurs évoquée plus haut.

La génération de la réponse s’effectue sous forme de décodage à partir de diverses méthodes probabilistes. Le modèle génère la réponse mot par mot (ou token par token), de façon itérative, en prédisant à chaque étape le token le plus probable suivant. Chaque mot dans la phrase générée est fonction du choix des mots précédents, en se basant sur la connaissance du langage que le modèle a acquise lors de la phase d’entraînement.

Afin d’éviter les répétitions ou les choix trop évidents, le modèle inclut des formes de variabilité. Plusieurs paramètres peuvent être ajustés pour moduler la qualité et la diversité des résultats. La température, notamment, est une formule mathématique associée aux modèles de génération probabiliste et qui contrôle le degré de créativité du modèle. Une température basse privilégie des sorties prévisibles et cohérentes, tandis qu’une température élevée favorise l’originalité.

Prenons l’exemple d’une question simple du type « Quelle est la capitale de la France ? » Le modèle de langage a été entraîné à reconnaître que « capitale » est souvent suivi d’un nom de ville. Il va donc chercher dans ses données d’entraînement les villes associées à la France et proposer « Paris » comme réponse la plus probable.

Ce caractère aléatoire de la gestion de contenus...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Comprendre la génération de contenus
Sommaire
Sommaire

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS