Attention

Documents numériques Gestion de contenu

Cet article issu de la base documentaire Représentation et traitemen... est en accès restreint

En savoir plus

Vous désirez plus d'informations sur le thème

Documents numériques Gestion de contenu

Documents numériques Gestion de contenu

OU

Vous vous intéressez au contenu de la base documentaire Représentation et traitement des documents numériques

fermer X

Vous consultez la base documentaire : Représentation et traitement des documents numériques / Référence 42312210

Traitement automatique des textes - Techniques linguistiques

Référence H7258 | Date de publication : 10 mai 2012 | Cécile FABRE

RESUME

Ce dossier est consacré à la présentation des techniques de traitement automatique des textes qui  sont utilisées aujourd’hui pour permettre de gérer de façon plus pertinente et plus efficace l’information qu’ils contiennent. L’article présente tout d’abord les besoins qui se manifestent actuellement dans les activités professionnelles pour des modes d’accès fins et variés au contenu des documents. Il fournit ensuite une présentation des applications, des méthodes et des ressources linguistiques qui sont mobilisées pour mener à bien ces procédures d’analyse de l’information textuelle. 

INTRODUCTION

Les documents disponibles sous forme électronique constituent une source d"informations majeure et suscitent le développement d"applications visant à faciliter leur gestion et leur exploitation. Ces données textuelles sont de natures très diverses :

  • documentation produite par l'entreprise, ses partenaires et ses clients (rapports techniques, documentation de maintenance, contrats, compte rendu de réunion, messages électroniques, etc.) ;

  • informations de nature technologique et économique que les entreprises doivent collecter et exploiter dans un environnement documentaire large et diversifié (brevets, rapports d'étude, littérature grise, actualités commerciales et techniques accessibles sur le web, etc.).

C'est par le biais de ces documents que l'essentiel des informations circule et il est donc crucial pour les organisations de disposer de techniques pour accéder aux connaissances métier qui sont contenues dans ces données. De fait, l"information stratégique est en grande partie de nature textuelle. Il est indispensable d'en prendre connaissance et de l'analyser pour :

  • assurer des tâches de veille scientifique et technologique, de gestion et de transfert de connaissances ;

  • assister la prise de décision, l'identification des risques, etc.

Or, ces données ont pour caractéristique d'être volumineuses et non structurées. Elles sont de natures très hétérogènes. Leur rédaction est rarement soumise à des normes explicites et peut être effectuée sous contrainte temporelle (production de rapports, de notes, de compte rendu, de courriers). Ces caractéristiques en font un matériau très difficile à traiter : les informations pertinentes doivent être extraites du flot textuel ; cette extraction est complexe du fait de l'ambiguïté et de la variabilité qui caractérisent l'expression langagière. L"exploitation de ces textes tout-venant est donc devenue un enjeu technologique majeur. De nouvelles solutions techniques, souvent qualifiées de « sémantiques » et d'« intelligentes » sont proposées aux entreprises pour :

  • maîtriser la profusion des documents électroniques – procédures pour classer les documents, les sélectionner, les synthétiser, les structurer ;

  • extraire et organiser les informations qu'ils contiennent.

Ces solutions font appel à des techniques de traitement automatique des langues TAL. L'objectif de ce dossier est de faire le point sur les traitements linguistiques automatisés qui sont mis en œuvre, et, en facilitant la compréhension de ces traitements, de permettre un choix raisonné parmi les solutions proposées dans le domaine du traitement de l'information.

Mots clés : | | | | |

LA
BOUTIQUE    ..............................................................................................................

Construction

Environnement et construction

Vignette Environnement et construction

Le développement durable impose une autre méthode de construction plus respectueuse de l'environnement en prenant en compte le cycle de vie des matériaux et les techniques de production de l'énergie.

Innovations

Innovations en technologies de l'information

Vignette Innovations en technologies de l'information

La veille technologique comme moteur d'innovation pour anticiper les prochaines évolutions de marché

Transports

Transport ferroviaire

Vignette Transport ferroviaire

Maîtriser et développer les activités liées au transport ferroviaire

Mécanique

Mécatronique

Vignette Mécatronique

Les concepts essentiels pour augmenter la fonctionnalité de vos produits