Contactez-nous
Évaluation et mise à jour
Thésaurus documentaire
H7250 v1 Article de référence

Évaluation et mise à jour
Thésaurus documentaire

Auteur(s) : Michèle HUDON

Date de publication : 10 nov. 2012 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Qu'est-ce qu'un thésaurus ?

  • 1.1 - Définitions
  • 1.2 - Composantes
  • 1.3 - Thésaurus et autres répertoires langagiers

2 - Structure

3 - Conception et développement

  • 3.1 - Normes et directives
  • 3.2 - Analyse des besoins et spécifications
  • 3.3 - Collecte des termes
  • 3.4 - Premiers regroupements sémantiques
  • 3.5 - Identification des équivalents
  • 3.6 - Sélection des descripteurs
  • 3.7 - Forme des termes
  • 3.8 - Définitions et notes
  • 3.9 - Relations hiérarchiques
  • 3.10 - Relations associatives
  • 3.11 - Concepts et descripteurs « orphelins »
  • 3.12 - Utilisation du thésaurus en développement pour l'indexation et la recherche

4 - Enregistrement et présentation des données

5 - Évaluation et mise à jour

  • 5.1 - Types et modalités d'évaluation
  • 5.2 - Mise à jour

6 - Logiciels pour le développement et la gestion des thésaurus

  • 6.1 - Catégories de logiciels
  • 6.2 - Évaluation et sélection

7 - À quoi et à qui sert le thésaurus ?

  • 7.1 - Aide à l'indexation
  • 7.2 - Aide à la recherche
  • 7.3 - Exploitation par les moteurs de recherche
  • 7.4 - Traitement automatique de la langue naturelle
  • 7.5 - Référentiel terminologique et sémantique

8 - Perspectives

Sommaire

Présentation

RÉSUMÉ

Cet article décrit la nature, les origines et la structure du thésaurus documentaire contemporain. Il détaille ensuite les étapes, les opérations et les instruments de son développement et de sa gestion, notamment à travers ses différentes normes, directives, analyses, relations. Il aborde finalement la question de son utilisation dans les systèmes d'information automatisés (par exemple l’enregistrement et la présentation des données), sans toutefois retenir des systèmes et de modalités d'utilisation particulières. Pour conclure cet article, les utilités du thésaurus sont précisées : son aide à l’indexation, à la recherche, ou encore son exploitation par moteurs de recherche.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Michèle HUDON : Professeur agrégé École de bibliothéconomie et des sciences de l'information Université de Montréal (Canada)

INTRODUCTION

Le thésaurus est un langage documentaire, c'est-à-dire un langage artificiel conçu pour permettre de générer la représentation formalisée des sujets dont traite un document d'une part, et du libellé des questions d'un utilisateur d'autre part, afin que ce dernier puisse repérer l'information ou les documents qui lui seront pertinents et utiles. Le thésaurus appartient à la grande variété de systèmes d'organisation des connaissances (SOC) disponibles pour faciliter la communication d'information.

Le thésaurus est désormais exploitable sous forme numérique et il constitue l'une des composantes importantes des systèmes d'information contemporains, dans les bases de données traditionnelles comme sur le web. Alors qu'il était à l'origine utilisé par des spécialistes formés à l'indexation et à la recherche d'information, le thésaurus se décline maintenant en versions utilisables par toute personne en quête d'information. Sa structure en permet également l'exploitation par des moteurs de recherche et par des logiciels de traitement de la langue naturelle au sein desquels il sert de base de connaissances.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7250

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Évaluation et mise à jour

L'évaluation et la mise à jour sont des fonctions essentielles de la gestion du thésaurus. Le thésaurus le mieux structuré et le plus adéquat sera éventuellement délaissé s'il n'est pas mis à jour régulièrement.

5.1 Types et modalités d'évaluation

L'évaluation structurelle vise à confirmer que les termes du lexique et la structure du thésaurus sont conformes aux normes. Cette évaluation objective doit être complétée par une évaluation, plus subjective celle-là, de l'efficacité du thésaurus dans sa fonction d'aide à la recherche. Quant à l'évaluation comparative, elle engage la mise en parallèle de plusieurs thésaurus (ou d'un thésaurus et d'autres types de langages documentaires) décrivant un même champ sémantique.

L'évaluation du thésaurus utilisé pour l'indexation dans un milieu documentaire spécifique est étroitement liée à celle du système d'indexation implanté dans ce même milieu ; le système d'indexation est évalué à l'aide de critères appliqués à l'entrée et à la sortie du système d'information. À l'entrée du système, le taux de cohérence entre indexeurs permet de mesurer, entre autres paramètres, la richesse lexicale et le degré de contrôle du vocabulaire structuré. À la sortie du système, on évalue les taux de précision, de bruit, de rappel et de silence, ce qui permet de déterminer si le niveau de spécificité du lexique est approprié.

HAUT DE PAGE

5.2 Mise à jour

L'évaluation est liée à la mise à jour. Mettre un thésaurus à jour, c'est enrichir son lexique et sa structure par l'ajout de nouveaux termes et de nouveaux liens sémantiques. Peu importe le type de changement apporté au contenu, il convient d'agir avec prudence car toute modification risque d'entraîner une cascade de changements structuraux non seulement dans le thésaurus lui-même, mais également dans les bases de données au sein desquelles il sert de langage d'indexation et de recherche.

HAUT DE PAGE

...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Évaluation et mise à jour

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - AITCHISON (J.), GILCHRIST (A.), BAWDEN (D.) -   Thesaurus construction and use.  -  4th ed., Aslib IMI, London (2000).

  • (2) - BROUGHTON (V.) -   Essential thesaurus construction  -  . Facet, London (2006).

  • (3) - DA SYLVA (L.) -   Thésaurus et systèmes de traitement automatique de la langue.  -  Documentation et bibliothèques, 52(2), p. 149-156 (2006).

  • (4) - DALBIN (S.) -   Thésaurus et informatiques documentaires : partenaires de toujours ?  -  Documentaliste, Sciences de l'information, 44(1), p. 42-55 (2007).

  • (5) - GANZMANN (J.) -   Criteria for the evaluation of thesaurus software.  -  International Classification, 17, p. 148-157 (1990).

  • (6) - GROUPE LANGAGES DOCUMENTAIRES DE L'ADBS -   Les normes de conception, gestion et maintenance de thésaurus : évolutions récentes et perspectives.  -  ...

1 Outils logiciels(liste non exhaustive)

MTM (gratuit) http://www.icie.com.pl/

The W32 (gratuit) http://publish.uwo.ca/~craven/freeware.htm

AGROVOC Thesaurus tools (logiciel libre) http://sourceforge.net/projects/agrovoct

ThManager (logiciel libre) http://thmanager.sourceforge.net

Cognatrix (logiciel commercial) http://www.lgosys.com/products/Cognatrix/index.html

ITM T3 (Terminologie, Thésaurus, Taxonomie, Dictionnaire de métadonnées) (logiciel commercial) http://www.mondeca.com/fr/Produits/ITM-T3

Multites (logiciel commercial) http://www.multites.com

MyThesaurus (logiciel commercial) http://www.mythesaurus.fr/fr/index.php

Thesaurus Builder (logiciel commercial) http://www.thesaurusbuilder.com/Default.aspx

Thesaurus Master (Data Harmony) (logiciel commercial) http://www.dataharmony.com/products/thesaurus_master.html

...
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre