Présentation
Auteur(s)
-
Véronique MESGUICH : Consultante formatrice en veille stratégique
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Les intelligences artificielles génératives (IA génératives) telles que ChatGPT révolutionnent de nombreux secteurs, notamment dans le domaine de la création de contenus, de la recherche d’information et de la veille. Comprendre leur fonctionnement est essentiel pour appréhender leur potentiel et leurs limites.
Cette fiche détaille le fonctionnement des IA génératives en trois étapes, décrivant les processus d’entraînement, de génération de contenus et d’optimisation.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Comprendre l’optimisation des modèles de langage
Après la période d’entraînement, il est souvent nécessaire d’optimiser le modèle pour améliorer ses performances dans des tâches spécifiques. Il existe là encore plusieurs approches. En voici deux exemples représentatifs.
3.1 Le « fine tuning »
Le fine tuning consiste à ajuster un modèle pré-entraîné sur des données supplémentaires ou spécifiques à une tâche donnée (par exemple, la traduction ou la classification de texte).
Cette méthode est utilisée pour adapter un modèle à un contexte particulier sans avoir à le réentraîner entièrement. Par exemple, GPT qui est initialement formé sur un vaste corpus généraliste peut être affiné sur un ensemble de données spécifiques pour exceller dans une tâche telle que la rédaction de rapports médicaux.
HAUT DE PAGE3.2 L’Apprentissage par renforcement
Certaines versions de modèles de langage peuvent utiliser l’apprentissage par renforcement pour améliorer les réponses en interaction avec des utilisateurs humains. Le modèle est récompensé lorsqu’il produit des résultats jugés de bonne qualité par les utilisateurs.
ChatGPT utilise des méthodes d’apprentissage par renforcement avec retour humain (RLHF, reinforcement learning from humanfeedback). Les utilisateurs peuvent, grâce à des icônes placées sous chaque réponse, évaluer la qualité du résultat. Les réponses qui reçoivent de bonnes évaluations voient leur pondération ajustée pour favoriser la génération de réponses similaires à l’avenir. Inversement, les réponses jugées de mauvaise qualité sont pénalisées, ce qui incite le modèle à éviter de générer de telles réponses. Ces retours humains peuvent contribuer à réduire les biais ou les réponses offensantes. En revanche, les annotateurs humains peuvent introduire leurs propres biais dans l’évaluation des réponses, ce qui peut se refléter dans le comportement du modèle.
Il est également possible d’ajuster le modèle pour qu’il respecte des contraintes éthiques : c’est le cas du modèle de langage...
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Comprendre l’optimisation des modèles de langage
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive