Principales applications
Génération automatique de résumés
H7260 v1 Archive

Principales applications
Génération automatique de résumés

Auteur(s) : Jean-Yves DELORT

Date de publication : 10 mai 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Sommaire

Présentation

RÉSUMÉ

Souvent, les humains doivent lire des documents dont les contenus sont complexes et longs à assimiler. L’objectif d’un résumé est de réduire la quantité d’effort nécessaire à l’acquisition des connaissances contenues dans un document. Un résumé peut être défini comme une représentation condensée, intelligible par un humain et non critique du contenu d’un autre document. La génération automatique de résumé (GAR) est utilisée pour répondre à ce besoin, et également plus largement pour synthétiser plusieurs textes. Elle s’applique également à des documents dans d’autres formats que le texte : les images, les sons et les vidéos.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Jean-Yves DELORT : Maître de conférences à l’université de Montpellier-2 , laboratoire d’informatique, de robotique et de microélectronique de Montpellier (LIRMM)

INTRODUCTION

Pour satisfaire leurs besoins en information ou acquérir des connaissances, les humains doivent souvent lire des documents dont les contenus sont complexes et longs à assimiler. L’objectif d’un résumé est de réduire la quantité d’effort nécessaire à l’acquisition des connaissances contenues dans un document. Un résumé peut être défini comme une représentation condensée, intelligible par un humain et non critique du contenu d’un autre document :

  • représentation condensée : un résumé permet de se faire rapidement une idée du contenu du document initial ;

  • intelligible par un humain : un résumé permet de diminuer les efforts nécessaires à un humain pour acquérir les connaissances contenues dans un document. L’humain est l’utilisateur direct d’un résumé. De ce fait, un résumé diffère d’une indexation ou d’une représentation servant à l’extraction ou au raisonnement à partir de connaissances ;

  • non critique : un résumé ne contient pas de commentaires ou de points de vue sur le document initial.

Nous démontrons ici l’intérêt de la génération automatique de résumé de documents avant d’analyser le problème et enfin de donner les principales solutions actuellement utilisées. Nous nous intéressons aux principales applications et aux concepts de la génération automatique de résumé (GAR). Après avoir expliqué le principe de la GAR, nous exposons les différents types d’améliorations qui peuvent être apportées. Les problématiques et les méthodes utilisées pour la GAR peuvent s’appliquer à la synthèse de plusieurs textes. Enfin, nous détaillons les problématiques et les méthodes de GAR de documents dans d’autres formats que le texte : les images, les sons et les vidéos.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7260

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

1. Principales applications

L’objectif de toute méthode de GAR (génération automatique de résumé) est de présenter l’essentiel d’un document afin de réduire l’énergie et le temps qu’il faudrait à une personne pour prendre connaissance de son contenu. La plupart des utilisations courantes d’outils de GAR ont pour objet d’aider à rechercher des informations dans des bases documentaires ou à surveiller le contenu de sources d’information.

1.1 Recherche d’informations

Aujourd’hui, entreprises, administrations et particuliers peuvent aisément se constituer des bases documentaires privées contenant plusieurs milliers, voire plusieurs millions, de documents.

Exemple

typiquement, un particulier peut avoir archivé tous ses e-mails, toutes ses photos, le catalogue de tous ses DVD ou CD, etc. Dans une entreprise ou une administration, les bases documentaires servent souvent à archiver la mémoire de l’entreprise (e-mails, rapports internes...) mais elles ont aussi souvent une utilisation directe. Par exemple, les techniciens assurant un support téléphonique utilisent des bases de connaissances qui fournissent les réponses à des milliers de problèmes. Pour travailler, les juristes ont besoin de rechercher dans des bases de décrets, de conventions et autres lois.

Afin de tirer profit de ces bases, il faut que les recherches aboutissent rapidement. La GAR peut jouer un rôle central pour réduire la durée des recherches car, même si un résumé ne répond pas directement aux besoins du lecteur, son contenu peut lui permettre de se faire une idée de l’intérêt du document et donc d’estimer si ce document vaut la peine d’être lu. La recherche dans les bases documentaires se fait généralement au moyen de deux types d’outils : les moteurs de recherche (§ 1.1.1) et les systèmes de question-réponse (§ 1.1.2). Il existe aussi des outils adaptés à des types particuliers de documents (§ 1.1.3).

...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Principales applications

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) -   *  -  Start, Natural Language Question Answering System. http://start.csail.mit.edu

  • (2) - ZHANG (Y.), ZINCIR-HEYWOOD (N.), MILIOS (E.) -   World wide web site summarization  -  . Web Intelligence and Agent Systems, 2, no 1, 39-53 (2004).

  • (3) - RADEV (D.R.), OTTERBACHER (J.), WINKEL (A.), BLAIR-GOLDENSOHN (S.) -   NewsInEssence: summarizing online news topics  -  . Communications of the ACM, 48 (10), 95-98 (2005).

  • (4) - BARD (S.) -   Méthodes d’évaluation de la qualité de données géographiques généralisées  -  . Thèse de doctorat, université Paris-6 (2004).

  • (5) - PASSONNEAU (R.), KUKICH (K.), HATZIVASSILOGLOU (V.), LEFKOWITZ (L.), JING (H.) -   Generating summaries of work flow diagrams  -  . Proceedings of the International Conference on Natural Language Processing and Industrial Applications, 204-210, New Brunswick, Canada (1996).

  • (6)...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Traitement automatique des textes - Techniques linguistiques

Cet article est consacré à la présentation des techniques de traitement automatique des textes qui sont ...

Utilisation des ressources du Web pour la classification conceptuelle

La masse des informations textuelles disponibles, notamment sur le Web, nécessite un traitement ...

Visualisation d'information

Les traces de l'activité du monde socio-économique sont l'objet d'analyse de toutes sortes pour mesurer ...