Du catalogage aux métadonnées
Métadonnées, ontologies et documents numériques
H7155 v2 Article de référence

Du catalogage aux métadonnées
Métadonnées, ontologies et documents numériques

Auteur(s) : Hélène RICHY, Sylvie DESPRÉS

Date de publication : 10 nov. 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Du catalogage aux métadonnées

2 - Description des ressources sur le Web

3 - Ontologies

4 - Conclusion

Sommaire

Présentation

RÉSUMÉ

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe de savoir analyser. Les métadonnées « électroniques » sont des informations sur des objets numériques qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes ».

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

INTRODUCTION

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques. Cette surabondance d'informations nécessite de disposer de nouvelles méthodes, de nouveaux modèles capables d'extraire des informations d'un fatras de connaissances mal structurées.

Les métadonnées « électroniques » sont des informations sur des objets numériques (image, texte, son) qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées, utilisées abondamment par les professionnels de la documentation, peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes » et appliquées à certains domaines (juridique, médical, pédagogique, etc.).

Après quelques rappels sur l'usage traditionnel des métadonnées dans les archives patrimoniales et les bibliothèques, le recours aux métadonnées est analysé dans le contexte du Web. Une place importante est donnée à la description des technologies basées sur XML qui jouent un rôle fondamental, aussi bien pour décrire les informations que pour les traiter. Enfin, dans une dernière partie sont présentées les nouvelles solutions visant à rendre les métadonnées compréhensibles par les machines, notamment les perspectives offertes par l'usage des ontologies.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h7155

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

1. Du catalogage aux métadonnées

Préambule

Le mot « Web » peut être considéré comme intégré à la langue française, nous l'utiliserons donc de préférence au terme « toile », choisi par les Québécois. Le terme « métadonnées » est utilisé pour désigner toutes les informations, tous les renseignements qui peuvent être associés à une ressource réelle ou virtuelle (œuvre littéraire ou artistique, image, film, page Web...).

1.1 Qu'est-ce que le concept de métadonnées ?

Le concept de métadonnées a évolué avec l'utilisation de l'Internet. Elles étaient initialement limitées aux informations d'archivage, permettant de retrouver un ouvrage ou un document dans une bibliothèque ou un service d'archives. Les métadonnées peuvent aussi répondre à d'autres objectifs : savoir quel usage peut être fait d'un ouvrage ou découvrir ce que contient effectivement une ressource.

Avec l'informatisation de la gestion des établissements publics ou commerciaux, les métadonnées ne sont plus seulement utilisées pour retrouver un ouvrage ou un enregistrement sonore, mais aussi pour stocker d'autres informations, invisibles au lecteur : l'état du stock, le nombre d'emprunts ou le prix d'achat par exemple. En particulier, lorsqu'il s'agit de documents à diffusion limitée, des métadonnées peuvent être pertinentes pour la sécurité ou la fiabilité des informations.

HAUT DE PAGE

1.1.1 Comment trouver une information ?

On peut considérer qu'il y a actuellement des millions de pages accessibles par leur adresse sur le Web. Cette adresse joue le rôle d'un numéro de référence dans une gigantesque bibliothèque. Mais, pour connaître les adresses des pages cherchées, il faut généralement interroger les sites qui proposent des moteurs de recherche, tels que Exalead, Google, Lycos ou Yahoo. Ces sites utilisent un robot qui recherche sur tout l'Internet, regardant le contenu des documents à la place du lecteur.

La plupart des moteurs de recherche ignorent les métadonnées. Ils se contentent généralement d'examiner le texte contenu dans le titre, l'adresse, l'en-tête ou le début d'un document...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Du catalogage aux métadonnées

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

DANS NOS BASES DOCUMENTAIRES

NORMES

  • Information et documentation. Format pour l'échange d'information. (MARC) - ISO 2709:1996 - 8-96

  • Traitement de l'information. Systèmes bureautiques. Langage normalisé de balisage généralisé (SGML) (rectificatifs en 1996 et 1999) - ISO 8879:1986 - 10-86

  • Systèmes de transfert des informations et données spatiales. Système ouvert d'archivage d'information. Modèle de référence (OAI-PMH) - ISO 14721:2003 - 3-03

  • Technologies de l'information. Interface de description de contenu multimédia. Partie 6 : logiciel de référence (MPEG-7) - ISO/CEI 15938-6:2003 - 7-03

  • Information et documentation. Une ontologie de référence pour l'échange d'informations sur l'héritage culturel - ISO 21127:2006 - 9-06

  • Uniform Resource Identifier (URI) : Generic Syntax - IETF RFC 3986 - 1-05

ANNEXES

  1. 1 Organismes

    1 Organismes

    American Memory http://memory.loc.gov/ammem/

    DAML http://www.daml.org

    DC, Dublin Core Metadata Initiative http://dublincore.org/

    DC, Dublin Core, Tools http://dublincore.org/groups/tools/

    DocBook http://www.docbook.org/

    DOI, Digital Object Identifier http://www.doi.org/

    EAD, Encoded Archival Description http://www.loc.gov/ead/

    Gallica, la bibliothèque numérique de la Bibliothèque nationale de France http://gallica.bnf.fr/

    HAL, Hyper Article en Ligne http://hal.archives-ouvertes.fr

    Handle, CNRI Handle System http://www.handle.net/

    IETF, Internet Engineering Task Force http://www.ietf.org

    LC, The Library of Congress http://www.loc.gov/

    MARC, Machine Readable Cataloging http://www.loc.gov/standards/

    METS, Metadata Encoding & Transmission Standard http://www.loc.gov/standards/mets

    MICHAEL, inventaire multilingue du patrimoine culturel européen http://www.michael-culture.org/

    OAI, Open Archives Initiative http://www.openarchives.org/

    OCLC, Online Computer Library Center http://www.oclc.org/

    PURL, Persistent Uniform Ressource Locator http://purl.net

    SCULPTEUR http://www.sculpteurweb.org

    SIMILE http://simile.mit.edu

    TEI, Text Encoding lnitiative http://www.tei-c.org/

    UNICODE, Universal Character enCoding http://www.unicode.org/

    W3C, World Wide Web Consortium http://www.w3.org/

    WebOut Working Group http://www.w3.org/2001/sw/WebOnt/

    ...
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 93 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Documents numériques Gestion de contenu"

    (66 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre

    Ressources documentaires

    XML et son écosystème

    Cet article traite de la structuration de fichiers XML, de la manière de les produire, de les utiliser, ...

    XML : syntaxe

    C’est une certitude, le langage XML est la nouvelle base du document numérique, grâce à ses nombreux ...