Contactez-nous
Perspectives
Thésaurus documentaire
H7250 v1 Article de référence

Perspectives
Thésaurus documentaire

Auteur(s) : Michèle HUDON

Date de publication : 10 nov. 2012 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Qu'est-ce qu'un thésaurus ?

  • 1.1 - Définitions
  • 1.2 - Composantes
  • 1.3 - Thésaurus et autres répertoires langagiers

2 - Structure

3 - Conception et développement

  • 3.1 - Normes et directives
  • 3.2 - Analyse des besoins et spécifications
  • 3.3 - Collecte des termes
  • 3.4 - Premiers regroupements sémantiques
  • 3.5 - Identification des équivalents
  • 3.6 - Sélection des descripteurs
  • 3.7 - Forme des termes
  • 3.8 - Définitions et notes
  • 3.9 - Relations hiérarchiques
  • 3.10 - Relations associatives
  • 3.11 - Concepts et descripteurs « orphelins »
  • 3.12 - Utilisation du thésaurus en développement pour l'indexation et la recherche

4 - Enregistrement et présentation des données

5 - Évaluation et mise à jour

  • 5.1 - Types et modalités d'évaluation
  • 5.2 - Mise à jour

6 - Logiciels pour le développement et la gestion des thésaurus

  • 6.1 - Catégories de logiciels
  • 6.2 - Évaluation et sélection

7 - À quoi et à qui sert le thésaurus ?

  • 7.1 - Aide à l'indexation
  • 7.2 - Aide à la recherche
  • 7.3 - Exploitation par les moteurs de recherche
  • 7.4 - Traitement automatique de la langue naturelle
  • 7.5 - Référentiel terminologique et sémantique

8 - Perspectives

Sommaire

Présentation

RÉSUMÉ

Cet article décrit la nature, les origines et la structure du thésaurus documentaire contemporain. Il détaille ensuite les étapes, les opérations et les instruments de son développement et de sa gestion, notamment à travers ses différentes normes, directives, analyses, relations. Il aborde finalement la question de son utilisation dans les systèmes d'information automatisés (par exemple l’enregistrement et la présentation des données), sans toutefois retenir des systèmes et de modalités d'utilisation particulières. Pour conclure cet article, les utilités du thésaurus sont précisées : son aide à l’indexation, à la recherche, ou encore son exploitation par moteurs de recherche.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Michèle HUDON : Professeur agrégé École de bibliothéconomie et des sciences de l'information Université de Montréal (Canada)

INTRODUCTION

Le thésaurus est un langage documentaire, c'est-à-dire un langage artificiel conçu pour permettre de générer la représentation formalisée des sujets dont traite un document d'une part, et du libellé des questions d'un utilisateur d'autre part, afin que ce dernier puisse repérer l'information ou les documents qui lui seront pertinents et utiles. Le thésaurus appartient à la grande variété de systèmes d'organisation des connaissances (SOC) disponibles pour faciliter la communication d'information.

Le thésaurus est désormais exploitable sous forme numérique et il constitue l'une des composantes importantes des systèmes d'information contemporains, dans les bases de données traditionnelles comme sur le web. Alors qu'il était à l'origine utilisé par des spécialistes formés à l'indexation et à la recherche d'information, le thésaurus se décline maintenant en versions utilisables par toute personne en quête d'information. Sa structure en permet également l'exploitation par des moteurs de recherche et par des logiciels de traitement de la langue naturelle au sein desquels il sert de base de connaissances.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7250

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

8. Perspectives

L'intérêt d'imposer un certain niveau de contrôle sémantique et terminologique à la langue naturelle est reconnu aussi bien par les producteurs que par les utilisateurs des systèmes d'information contemporains. Le thésaurus documentaire est un instrument dont l'utilité n'est plus mise en doute, même en présence de moteurs de recherche capables de manipuler la langue assez efficacement. Le thésaurus est un système d'organisation et de représentation des connaissances et de l'information fiable, prévisible et stable. La disponibilité d'un thésaurus logiquement structuré et régulièrement mis à jour contribue à une amélioration marquée de la précision, de la cohérence et de la qualité de la représentation des sujets aussi bien que des résultats de la recherche d'information.

Parce qu'ils rendent possibles la représentation et le repérage très pointus, on considère que les thésaurus disciplinaires et les thésaurus d'entreprise sont plus efficaces que les langages encyclopédiques comme outil d'aide à la recherche d'information. Pour satisfaire les besoins exprimés dans leur milieu, les gestionnaires ont pris le parti de doter chacune de leurs bases de données d'un thésaurus approprié, unique, spécifique et bien sûr très performant. Ces thésaurus ont été développés dans plusieurs langues naturelles et dans le respect de caractéristiques liées à l'environnement immédiat d'utilisation. Or, l'arrivée du web et des systèmes d'information en grands réseaux a accru la nécessité et la difficulté d'utiliser plus d'un thésaurus pour exploiter plusieurs bases de données et accéder à l'information requise. L'ouverture des systèmes et la transformation des canaux traditionnels de circulation de l'information peuvent donc être coûteuses en temps, en efforts intellectuels et en argent, et cela sans même garantir une exploitation optimale des banques d'information disponibles.

La communication et le partage d'information ne sont pleinement efficaces que si les langages documentaires utilisés dans diverses bases de données sont identiques, similaires ou à tout le moins compatibles. La nécessité d'assurer l'efficacité de la recherche fédérée dans plusieurs bases de données a suscité la renaissance d'un mouvement, discrètement présent au début des années 1970, de recherche d'une solution optimale aux problèmes d'incompatibilité des lexiques et des structures ; ce...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Perspectives

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - AITCHISON (J.), GILCHRIST (A.), BAWDEN (D.) -   Thesaurus construction and use.  -  4th ed., Aslib IMI, London (2000).

  • (2) - BROUGHTON (V.) -   Essential thesaurus construction  -  . Facet, London (2006).

  • (3) - DA SYLVA (L.) -   Thésaurus et systèmes de traitement automatique de la langue.  -  Documentation et bibliothèques, 52(2), p. 149-156 (2006).

  • (4) - DALBIN (S.) -   Thésaurus et informatiques documentaires : partenaires de toujours ?  -  Documentaliste, Sciences de l'information, 44(1), p. 42-55 (2007).

  • (5) - GANZMANN (J.) -   Criteria for the evaluation of thesaurus software.  -  International Classification, 17, p. 148-157 (1990).

  • (6) - GROUPE LANGAGES DOCUMENTAIRES DE L'ADBS -   Les normes de conception, gestion et maintenance de thésaurus : évolutions récentes et perspectives.  -  ...

1 Outils logiciels(liste non exhaustive)

MTM (gratuit) http://www.icie.com.pl/

The W32 (gratuit) http://publish.uwo.ca/~craven/freeware.htm

AGROVOC Thesaurus tools (logiciel libre) http://sourceforge.net/projects/agrovoct

ThManager (logiciel libre) http://thmanager.sourceforge.net

Cognatrix (logiciel commercial) http://www.lgosys.com/products/Cognatrix/index.html

ITM T3 (Terminologie, Thésaurus, Taxonomie, Dictionnaire de métadonnées) (logiciel commercial) http://www.mondeca.com/fr/Produits/ITM-T3

Multites (logiciel commercial) http://www.multites.com

MyThesaurus (logiciel commercial) http://www.mythesaurus.fr/fr/index.php

Thesaurus Builder (logiciel commercial) http://www.thesaurusbuilder.com/Default.aspx

Thesaurus Master (Data Harmony) (logiciel commercial) http://www.dataharmony.com/products/thesaurus_master.html

...
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre