Motivations de l’utilisation des classifications conceptuelles
Utilisation des ressources du Web pour la classification conceptuelle
H7420 v1 Article de référence

Motivations de l’utilisation des classifications conceptuelles
Utilisation des ressources du Web pour la classification conceptuelle

Auteur(s) : Mathieu ROCHE

Date de publication : 10 mai 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Motivations de l’utilisation des classifications conceptuelles

  • 1.1 - Extraction d’information dans les textes
  • 1.2 - Classification conceptuelle et extraction d’information
  • 1.3 - Découverte de règles d’association entre concepts

2 - Du corpus à la classification conceptuelle

3 - Utilisation du Web comme corpus pour des tâches de classification conceptuelle

  • 3.1 - Acquisition d’un corpus à partir du Web
  • 3.2 - Le Web, un corpus à part entière

4 - Conclusion

Sommaire

Présentation

RÉSUMÉ

La masse des informations textuelles disponibles, notamment sur le Web, nécessite un traitement automatique pour une analyse pertinente de ces données. La veille, technologique ou économique, consiste à rechercher, traiter et diffuser des renseignements utiles à l’entreprise. Toutes les méthodes de veille appliquées aux données textuelles utilisent des systèmes de traitement automatique des langues, dit TAL, et de fouille de textes. Pour rendre ces outils plus efficaces, l’utilisation de connaissances du domaine telles que des classifications conceptuelles se révèle essentielle.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Mathieu ROCHE : Maître de conférences à l’université de Montpellier-2Laboratoire d’informatique, de robotique et de microélectronique de Montpellier (LIRMM)

INTRODUCTION

La masse des informations textuelles disponibles, notamment sur le Web, nécessite un traitement automatique pour une analyse pertinente de ces données. Cela s’avère particulièrement utile pour découvrir les informations stratégiques afin d’anticiper et de prendre des décisions sur les environnements socio-économiques. On utilise alors le terme de veille technologique pour l’étude de l’évolution des données techniques et scientifiques (articles scientifiques, brevets technologiques, etc.). Un domaine de veille en développement croissant concerne la veille économique (ou intelligence économique). Elle consiste à rechercher, traiter et diffuser des renseignements utiles à l’entreprise. La veille économique comprend notamment la veille à la concurrence et au marché. L’ensemble de ces méthodes de veille appliquées aux données textuelles utilise des systèmes de TAL (traitement automatique des langues) et de fouille de textes décrits ici. Pour rendre ces outils plus efficaces, l’utilisation de connaissances du domaine telles que des classifications conceptuelles se révèle essentielle. Nous verrons en particulier de quelle manière les ressources du Web peuvent aider à la construction automatique ou semi-automatique de classifications conceptuelles.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7420

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

1. Motivations de l’utilisation des classifications conceptuelles

1.1 Extraction d’information dans les textes

Une des tâches typiquement utilisées dans le cadre de la veille économique consiste à extraire des informations à partir de textes. Cela permet de remplir automatiquement des formulaires utiles pour les synthétiser. Des applications évidentes peuvent être menées à partir de dépêches d’actualité économique, politique, culturelle, etc. L’exemple ci-après illustre une dépêche économique à laquelle le formulaire FormEco est associé.

Dépêche économique

L’Europe donne son feu vert au rachat de Materis par Wendel. Annoncé début janvier, le rachat par Wendel Investissement de Materis appartenant à LBO France s’élève à 1,01 milliard d’euros. Une transaction qui valorise Materis à environ 2 MdE. Si Wendel Investissement et Materis ne sont pas présentes sur les mêmes marchés, Materis achète certains services fournis par le Bureau Veritas qui appartient à Wendel. Bureau Veritas s’occupe du contrôle et de la certification de produits, de procédés et de projets.

31/03/2006

Pour extraire des informations et remplir le formulaire FormEco à partir d’une dépêche d’actualité, nous pouvons utiliser des patrons d’extraction tels que celui-ci :

Le rachat par <acquéreur> de <objet> appartenant à <vendeur> s’élève à <montant> (1)

Ainsi, le patron (1) permet de remplir le formulaire FormEco :

Des exemples de patrons d’extraction issus du domaine économique qui peuvent se révéler extrêmement complexes en raison de la subtilité du langage naturel sont donnés dans . Certains outils n’utilisent pas directement des patrons d’extraction. En effet, la méthode d’extraction d’informations comporte en général les étapes suivantes :

  • analyser les textes (analyse lexicale et syntaxique) ;

  • extraire des éléments...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Motivations de l’utilisation des classifications conceptuelles

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - WATRIN (P.) -   Extraction d’information et lexique-grammaire de spécialité.  -  Actes du 23e Colloque international « Grammaires et lexiques comparés » (2004).

  • (2) - KODRATOFF (Y.) -   Induction extensionnelle : définition et application d’acquisition de concepts à partir de textes.  -  Revue RNTI E2, numéro spécial EGC’04, 247-252 (2004).

  • (3) - FAURE (D.) -   Conception de méthode d’apprentissage symbolique et automatique pour l’acquisition de cadres de sous-catégorisation de verbes et de connaissances sémantiques à partir de textes : le système ASIUM.  -  Thèse de doctorat, université Paris-Sud (2000).

  • (4) - NÉDELLEC (C.), NAZARENKO (A.) -   Application de l’apprentissage à la recherche et à l’extraction d’information – Un exemple, le projet Caderige : identification d’interactions géniques.  -  Actes de la Journée thématique Exploration de données issues d’Internet (2001).

  • (5) - AZÉ (J.), ROCHE (M.) -   Une...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

XML : syntaxe

C’est une certitude, le langage XML est la nouvelle base du document numérique, grâce à ses nombreux ...

XML et son écosystème

Cet article traite de la structuration de fichiers XML, de la manière de les produire, de les utiliser, ...

Métadonnées, ontologies et documents numériques

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe ...