Contactez-nous
Comprendre l’optimisation des modèles de langage
Comprendre le fonctionnement des IA génératives
FIC1859 v1 Fiche pratique

Comprendre l’optimisation des modèles de langage
Comprendre le fonctionnement des IA génératives

Auteur(s) : Véronique MESGUICH

Date de publication : 10 oct. 2024 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Distinguer les formes d’apprentissages

2 - Comprendre la génération de contenus

3 - Comprendre l’optimisation des modèles de langage

  • 3.1 - Le « fine tuning »
  • 3.2 - L’Apprentissage par renforcement

4 - Notre conseil

  • 4.1 - Utilisez des modèles open source pour mieux comprendre le fonctionnement

5 - Erreurs à éviter

  • 5.1 - Ne croyez pas que les modèles de langage « comprennent » véritablement le langage de manière humaine
Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Les intelligences artificielles génératives (IA génératives) telles que ChatGPT révolutionnent de nombreux secteurs, notamment dans le domaine de la création de contenus, de la recherche d’information et de la veille. Comprendre leur fonctionnement est essentiel pour appréhender leur potentiel et leurs limites.

Cette fiche détaille le fonctionnement des IA génératives en trois étapes, décrivant les processus d’entraînement, de génération de contenus et d’optimisation.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1859

Lecture en cours
Présentation

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

3. Comprendre l’optimisation des modèles de langage

Après la période d’entraînement, il est souvent nécessaire d’optimiser le modèle pour améliorer ses performances dans des tâches spécifiques. Il existe là encore plusieurs approches. En voici deux exemples représentatifs.

3.1 Le « fine tuning »

Le fine tuning consiste à ajuster un modèle pré-entraîné sur des données supplémentaires ou spécifiques à une tâche donnée (par exemple, la traduction ou la classification de texte).

Cette méthode est utilisée pour adapter un modèle à un contexte particulier sans avoir à le réentraîner entièrement. Par exemple, GPT qui est initialement formé sur un vaste corpus généraliste peut être affiné sur un ensemble de données spécifiques pour exceller dans une tâche telle que la rédaction de rapports médicaux.

HAUT DE PAGE

3.2 L’Apprentissage par renforcement

Certaines versions de modèles de langage peuvent utiliser l’apprentissage par renforcement pour améliorer les réponses en interaction avec des utilisateurs humains. Le modèle est récompensé lorsqu’il produit des résultats jugés de bonne qualité par les utilisateurs.

ChatGPT utilise des méthodes d’apprentissage par renforcement avec retour humain (RLHF, reinforcement learning from humanfeedback). Les utilisateurs peuvent, grâce à des icônes placées sous chaque réponse, évaluer la qualité du résultat. Les réponses qui reçoivent de bonnes évaluations voient leur pondération ajustée pour favoriser la génération de réponses similaires à l’avenir. Inversement, les réponses jugées de mauvaise qualité sont pénalisées, ce qui incite le modèle à éviter de générer de telles réponses. Ces retours humains peuvent contribuer à réduire les biais ou les réponses offensantes. En revanche, les annotateurs humains peuvent introduire leurs propres biais dans l’évaluation des réponses, ce qui peut se refléter dans le comportement du modèle.

Il est également possible d’ajuster le modèle pour qu’il respecte des contraintes éthiques : c’est le cas du modèle de langage...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Comprendre l’optimisation des modèles de langage

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre