Présentation

Article

1 - RECHERCHE D’INFORMATION CLASSIQUE

2 - (GRANDS) MODÈLES DE LANGUE

3 - PROCESSUS GÉNÉRATIF AUGMENTÉ PAR LA RECHERCHE D’INFORMATION

4 - ARCHITECTURES RAG AVANCÉES

5 - ÉVALUATION D’UNE SOLUTION RAG

  • 5.1 - Évaluation des pré-traitements
  • 5.2 - Évaluation du module Retriever
  • 5.3 - Évaluation de la réponse générée
  • 5.4 - Des collections de test adaptées au RAG

6 - SOLUTIONS LOGICIELLES ET EXEMPLES

7 - CONCLUSION

Article de référence | Réf : H6042 v1

Processus génératif augmenté par la recherche d’information
Optimiser l’IA générative avec le RAG - La génération de réponses à partir de LLMs, augmentée par la recherche d’information

Auteur(s) : Patrice BELLOT

Date de publication : 10 oct. 2025 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

RÉSUMÉ

La recherche d’information couvre de nombreuses applications qui vont de la recherche documentaire à partir de requêtes booléennes à celle de la génération et l’extraction de réponses précises à des questions en langue naturelle. Elle s’applique à des textes, des images ou de l’audio et peut-être interactive, sous forme de dialogues avec un agent conversationnel. Cet article s’intéresse au croisement de la recherche d’information avec l’IA générative, ce que l’on nomme génération augmentée (de réponses) par la recherche d’information (RAG). Le RAG permet d’assister la génération de réponses à partir d’un grand modèle de langue et de sources d’informations qui peuvent être privées. Les grands modèles de langue et les architectures RAG sont présentées (RAG agentique, GraphRAG...), tout comme les nombreuses stratégies pouvant être suivies. Ce couplage entre apprentissage machine neuronal, traitement automatique des langues et recherche d’information traditionnelle nécessite de repenser les processus de recherche, d’indexation et de stockage des données au moyen d’entrepôts de données, d’APIs et d’environnements logiciels ad-hoc. Même si elles demeurent perfectibles dans certaines situations et si leur déploiement est rarement aisé, ces solutions sont désormais matures. Elles sont discutées sous un angle scientifique et technologique.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Patrice BELLOT : Professeur des Universités - Aix-Marseille Université, CNRS, Polytech, Marseille, France

INTRODUCTION

Sans l’IA générative et la génération de réponses assistée, la recherche d’information est réalisable à l’aide de moteurs de recherche qui, à partir de documents non structurés, répondent aux requêtes seulement par des listes de documents, ou bien par l’interrogation de bases de données, qui nécessitent une organisation complexe et coûteuse des données sources. Le RAG (Retrieval Augmented Generation) est une troisième voie, qui permet d’intégrer la recherche d’information aux usages majeurs des agents conversationnels.

Les années 2010-2020 ont vu l’émergence d’approches de l’apprentissage machine neuronal et du traitement automatique des langues, qui ont rapidement été exploitées pour la recherche et l’extraction d’information et, plus largement encore, pour l’ingénierie des connaissances. Les grands modèles de langue aident non seulement à obtenir des représentations sémantiques de documents, mais aussi, sous leur forme générative, à créer des réponses fluides et compréhensibles à des questions complexes, exprimées sous forme de « prompts ».

Malheureusement, le coût d’entraînement des grands modèles de langue limite cette opération à une poignée d’acteurs de l’IA qui, outre le fait de disposer d’infrastructures de calcul hors normes, exploitent des données qui s’étendent bien au-delà du seul Web public. Même si l’affinage des grands modèles de langue pré-entraînés et diffusés librement est une opération moins coûteuse qu’un entraînement complet, et permet une adaptation à des domaines de spécialité ou à des données privées, il n’est pas suffisant pour déployer des moteurs de recherche sûrs. En effet, l’affinage doit demeurer léger, sous peine de rendre le modèle incapable de générer du texte compréhensible. Un modèle, même affiné, reste tributaire de ses données d’entraînement d’origine. Prétendre vouloir répondre à des questions précises à l’aide d’un modèle génératif seul entraîne ainsi un risque grand d’obtenir des réponses obsolètes, erronées (hallucinations), ou confuses, du seul fait de la présence d’informations contradictoires dans les données d’entraînement. En outre, exploitées sans précaution, ces masses de données reflètent des biais sociétaux majeurs, et mélangent sans discernement opinions et fausses informations.

À défaut d’être une solution miracle et universelle, le RAG permet de réduire les risques qui viennent d’être énoncés. L’idée principale est de forcer le grand modèle de langue à générer des réponses dont les informations proviennent d’un ensemble de données présélectionnées à la volée en fonction de la requête. Les connaissances générales du modèle ne doivent servir qu’à assurer la compétence linguistique utile à la génération d’une réponse compréhensible.

La majeure partie de cet article est consacrée à la description d’un système RAG, de manière à permettre la création de prototypes logiciels fonctionnels, à partir d’une bonne compréhension des principes théoriques, et de la connaissance des solutions réutilisables disponibles librement. Les solutions décrites dans cet article se concentrent sur l’usage du RAG pour des documents textuels, mais la disponibilité de modèles fondation et de modèles multimodaux assure un transfert vers des données comprenant des données orales, des vidéos ou des codes sources.

Le § 1 introduit la recherche d’information sous sa forme traditionnelle, de manière à pouvoir comprendre son rôle dans un système RAG, et comment ce dernier peut être intégré à une solution de recherche existante. Le § 2 concerne les grands modèles de langue et les familles de modèles. Elle permet d’introduire le § 3, consacré à l’emploi de ces modèles, non seulement pour représenter les documents sous une forme compatible avec une recherche dite sémantique, mais aussi pour générer les réponses. Le § 4 présente des architectures plus avancées. Elles concernent des stratégies et des architectures dynamiques tenant compte de la nature des questions posées : le RAG agentique, qui assure flexibilité et extensibilité au système de recherche, et le RAG graphique (GraphRAG), qui exploite des bases de données orientées graphe, et peut identifier des relations lointaines entre entités dans les documents. Le § 5 est consacré à l’évaluation du RAG, et le § 6 présente des solutions logicielles, des plateformes SaaS et des environnements et bibliothèques Python pour un RAG sur mesure.

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h6042


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

3. Processus génératif augmenté par la recherche d’information

La mise en œuvre d’une approche RAG nécessite de combiner un grand nombre de composants logiciels et de modèles, qu’il convient de sélectionner avec soin, en fonction de leurs caractéristiques techniques, des cas d’utilisation envisagés et des contraintes qui leur sont associées. Parmi les critères à considérer figurent :

  • la nature, le volume et la confidentialité des sources d’information (documents et bases de connaissance, ou encore le Web) ;

  • l’adéquation des modèles disponibles et le besoin de les affiner sur de nouvelles données ;

  • le niveau d’interactivité et de disponibilité (temps de réponse, passage à l’échelle) souhaité.

Le déploiement d’une solution RAG est associé à des choix architecturaux déterminants, et à une phase de mise au point qui peut être complexe, tant les stratégies et les paramètres sont nombreux.

3.1 Architecture d’un système RAG de base

L’architecture d’un système RAG comprend deux modules principaux (figure 10) :

  • un module de recherche d’information (Retriever) ;

  • un module de génération de réponse.

Comme nous le verrons, différentes variantes de cette architecture peuvent être mises en œuvre. Le processus séquentiel et statique de base peut alors devenir itératif, ou dynamique. En outre, chaque module peut suivre des stratégies diverses, impliquant elles-mêmes plusieurs sous-modules.

HAUT DE PAGE

3.2 Module de récupération Retriever

Le module de récupération nécessite un encodage de la requête (ici le prompt, l’instruction ou l’invite système), et un encodage préalable de la base documentaire cible (indexation de la source d’information). Il procède à une sélection de documents, ou plutôt de passages de documents (chunks), qui sont ensuite injectés dans le prompt en tant que « contexte ».

Le premier point critique dans la création d’un système RAG concerne l’analyse et l’exploration de la source documentaire, qui sous-tend la manière dont elle pourra être exploitée. L’idée...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Processus génératif augmenté par la recherche d’information
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - AMINI (M.-R.), GAUSSIER (E.) -   Recherche d’information : Applications, modèles et algorithmes-Fouille de données, décisionnel et big data.  -  Éditions Eyrolles (2013).

  • (2) - ROBERTSON (S.E.), WALKER (S.) -   Some simple effective approximations to the 2-poisson model for probabilistic weighted retrieval.  -  In SIGIR’94: Proceedings of the Seventeenth Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval, organised by Dublin City University p. 232–241. Springer (1994).

  • (3) - DUMAIS (S.T.) -   Latent semantic analysis.  -  Annual Review of Information Science and Technology (ARIST), 38, p. 189–230 (2004).

  • (4) -   *  -  https://www.nltk.org

  • (5) -   *  -  https://spacy.io

  • (6) - LE CUN (Y.) -   Quand la machine apprend :...

ANNEXES

  1. 1 Annuaire

    1 Annuaire

    Constructeurs – Fournisseurs – Distributeurs (liste non exhaustive)

    Elastic

    https://www.elastic.co/fr/

    Emvista

    https://emvista.com

    Hugging Face

    https://huggingface.co

    Le Sphinx

    https://www.lesphinx-developpement.fr

    Mistral AI

    https://mistral.ai

    Perplexity

    https://www.perplexity.ai

    Qwant

    https://www.qwant.com/

    Sinequa

    https://www.sinequa.com

    Synapse Développement

    https://www.synapse-developpement.fr

    Organismes – Fédérations – Associations (liste non exhaustive)

    Association for Computational Linguistics (ACL)

    https://www.aclweb.org/

    Association Francophone de Recherche d’Information (RI) et Applications (ARIA)

    https://www.asso-aria.org

    Association pour le Traitement Automatique des Langues (ATALA)

    https://www.atala.org/

    Association Internationale Francophone d’Extraction et de Gestion des Connaissances (EGC)

    https://www.egc.asso.fr

    Société Informatique de France (SIF)

    https://www.socinfo.fr

    Special Interest Group on Information Retrieval (SIGIR)

    https://sigir.org

    Documentation – Formation – Séminaires (liste non exhaustive)

    Conference and Labs of the Evaluation Forum...

    Cet article est réservé aux abonnés.
    Il vous reste 94% à découvrir.

    Pour explorer cet article
    Téléchargez l'extrait gratuit

    Vous êtes déjà abonné ?Connectez-vous !


    L'expertise technique et scientifique de référence

    La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
    + de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
    De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

    Cet article fait partie de l’offre

    Documents numériques Gestion de contenu

    (68 articles en ce moment)

    Cette offre vous donne accès à :

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques

    Des services

    Un ensemble d'outils exclusifs en complément des ressources

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

    Doc & Quiz

    Des articles interactifs avec des quiz, pour une lecture constructive

    ABONNEZ-VOUS