3 - COMPRENDRE L’OPTIMISATION DES MODÈLES DE LANGAGE

3.1 - Le « fine tuning »
3.2 - L’Apprentissage par renforcement

4.1 - Utilisez des modèles open source pour mieux comprendre le fonctionnement

5 - ERREURS À ÉVITER

5.1 - Ne croyez pas que les modèles de langage « comprennent » véritablement le langage de manière humaine

Fiche pratique | Réf : FIC1859 v1

Comprendre l’optimisation des modèles de langage
Comprendre le fonctionnement des IA génératives

Auteur(s) : Véronique MESGUICH

Date de publication : 10 oct. 2024 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

Auteur(s)

Véronique MESGUICH : Consultante formatrice en veille stratégique

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Les intelligences artificielles génératives (IA génératives) telles que ChatGPT révolutionnent de nombreux secteurs, notamment dans le domaine de la création de contenus, de la recherche d’information et de la veille. Comprendre leur fonctionnement est essentiel pour appréhender leur potentiel et leurs limites.

Cette fiche détaille le fonctionnement des IA génératives en trois étapes, décrivant les processus d’entraînement, de génération de contenus et d’optimisation.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1859

Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Notre conseil

3. Comprendre l’optimisation des modèles de langage

Après la période d’entraînement, il est souvent nécessaire d’optimiser le modèle pour améliorer ses performances dans des tâches spécifiques. Il existe là encore plusieurs approches. En voici deux exemples représentatifs.

3.1 Le « fine tuning »

Le fine tuning consiste à ajuster un modèle pré-entraîné sur des données supplémentaires ou spécifiques à une tâche donnée (par exemple, la traduction ou la classification de texte).

Cette méthode est utilisée pour adapter un modèle à un contexte particulier sans avoir à le réentraîner entièrement. Par exemple, GPT qui est initialement formé sur un vaste corpus généraliste peut être affiné sur un ensemble de données spécifiques pour exceller dans une tâche telle que la rédaction de rapports médicaux.

HAUT DE PAGE

3.2 L’Apprentissage par renforcement

Certaines versions de modèles de langage peuvent utiliser l’apprentissage par renforcement pour améliorer les réponses en interaction avec des utilisateurs humains. Le modèle est récompensé lorsqu’il produit des résultats jugés de bonne qualité par les utilisateurs.

ChatGPT utilise des méthodes d’apprentissage par renforcement avec retour humain (RLHF, reinforcement learning from humanfeedback). Les utilisateurs peuvent, grâce à des icônes placées sous chaque réponse, évaluer la qualité du résultat. Les réponses qui reçoivent de bonnes évaluations voient leur pondération ajustée pour favoriser la génération de réponses similaires à l’avenir. Inversement, les réponses jugées de mauvaise qualité sont pénalisées, ce qui incite le modèle à éviter de générer de telles réponses. Ces retours humains peuvent contribuer à réduire les biais ou les réponses offensantes. En revanche, les annotateurs humains peuvent introduire leurs propres biais dans l’évaluation des réponses, ce qui peut se refléter dans le comportement du modèle.

Il est également possible d’ajuster le modèle pour qu’il respecte des contraintes éthiques : c’est le cas du modèle de langage...

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Comprendre l’optimisation des modèles de langage

Page
précédenteComprendre la génération de contenus

Page
suivante

Notre conseil

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Comprendre l’optimisation des modèles de langage Comprendre le fonctionnement des IA génératives

Auteur(s)

INTRODUCTION

Cet article est réservé aux abonnés.Il vous reste 94% à découvrir.

L'expertise technique et scientifique de référence

DOI (Digital Object Identifier)

3. Comprendre l’optimisation des modèles de langage

Cet article est réservé aux abonnés.Il vous reste 94% à découvrir.

L'expertise technique et scientifique de référence

Cet article est réservé aux abonnés.Il vous reste 94% à découvrir.

L'expertise technique et scientifique de référence

Comprendre l’optimisation des modèles de langage
Comprendre le fonctionnement des IA génératives

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.