Description des ressources sur le Web
Métadonnées, ontologies et documents numériques
H7155 v2 Article de référence

Description des ressources sur le Web
Métadonnées, ontologies et documents numériques

Auteur(s) : Hélène RICHY, Sylvie DESPRÉS

Date de publication : 10 nov. 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Du catalogage aux métadonnées

2 - Description des ressources sur le Web

3 - Ontologies

4 - Conclusion

Sommaire

Présentation

RÉSUMÉ

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe de savoir analyser. Les métadonnées « électroniques » sont des informations sur des objets numériques qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes ».

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

INTRODUCTION

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques. Cette surabondance d'informations nécessite de disposer de nouvelles méthodes, de nouveaux modèles capables d'extraire des informations d'un fatras de connaissances mal structurées.

Les métadonnées « électroniques » sont des informations sur des objets numériques (image, texte, son) qui décrivent aussi bien le contenu de ces objets que leur gestion, leur structure, leur contexte ou les conditions d'accès. Les métadonnées, utilisées abondamment par les professionnels de la documentation, peuvent déjà faciliter l'accès à certains documents archivés. Toutefois, le recours à des ontologies, permettant d'organiser, de structurer les connaissances, commence à s'imposer afin d'obtenir des informations « plus intelligentes » et appliquées à certains domaines (juridique, médical, pédagogique, etc.).

Après quelques rappels sur l'usage traditionnel des métadonnées dans les archives patrimoniales et les bibliothèques, le recours aux métadonnées est analysé dans le contexte du Web. Une place importante est donnée à la description des technologies basées sur XML qui jouent un rôle fondamental, aussi bien pour décrire les informations que pour les traiter. Enfin, dans une dernière partie sont présentées les nouvelles solutions visant à rendre les métadonnées compréhensibles par les machines, notamment les perspectives offertes par l'usage des ontologies.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h7155

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

2. Description des ressources sur le Web

Sans entrer dans une description détaillée du Web, il peut être utile, pour la compréhension de ce qui suit, de rappeler le fonctionnement du Web. Le Web peut être vu comme un réseau permettant des échanges d'information basés sur :

  • un mécanisme d'identification des ressources (les URI) : une « ressource » désigne tout ou partie d'une page Web, qu'il s'agisse de texte, d'image ou de son ;

  • des formats de représentation des ressources (XHTML, XML) et de codage (Unicode) : l'universalité du Web, ouvert à toutes les langues, toutes les cultures, impose de supporter différents codages de caractères, ce qui conduit à adopter le codage Unicode ;

  • un mécanisme d'échange des ressources : plusieurs protocoles de communication sont utilisables, selon qu'il s'agit d'échanger des documents HTML (HTTP : HypertText Transfer Protocol), des fichiers (FTP : File Transfer Protocol) ou des messages (SMTP : Simple Mail Transfer Protocol).

Le Web offre des facilités d'échange de documents multimédias, intégrant le texte, l'image ou le son. Cette situation conduit à développer des systèmes de conversion numérique de l'information pour diffuser toutes sortes de documents numériques par ce canal. De nombreuses campagnes de numérisation du patrimoine sont en cours, dans le monde entier. Mais la situation n'est pas tout à fait aussi idyllique qu'il y paraît : une harmonisation entre les différents systèmes d'identification des ressources et de métadonnées reste une priorité pour répondre aux besoins de cette vaste diffusion des connaissances. Afin de pouvoir partager les informations, les ressources doivent pouvoir être clairement identifiées. Le W3C préconise donc pour le Web sémantique d'utiliser un mode de désignation qui garantisse l'unicité de la ressource et sa qualité, et qui permette d'agréger des métadonnés s'y référant.

Avant d'envisager les nouvelles applications favorisées par cette initiative, nous allons rappeler comment fonctionne la désignation des ressources et analyser quel est l'apport de RDF pour la description de ces ressources.

2.1 Identification d'une ressource

HAUT DE PAGE

2.1.1 Localisation

La désignation...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Description des ressources sur le Web

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

DANS NOS BASES DOCUMENTAIRES

NORMES

  • Information et documentation. Format pour l'échange d'information. (MARC) - ISO 2709:1996 - 8-96

  • Traitement de l'information. Systèmes bureautiques. Langage normalisé de balisage généralisé (SGML) (rectificatifs en 1996 et 1999) - ISO 8879:1986 - 10-86

  • Systèmes de transfert des informations et données spatiales. Système ouvert d'archivage d'information. Modèle de référence (OAI-PMH) - ISO 14721:2003 - 3-03

  • Technologies de l'information. Interface de description de contenu multimédia. Partie 6 : logiciel de référence (MPEG-7) - ISO/CEI 15938-6:2003 - 7-03

  • Information et documentation. Une ontologie de référence pour l'échange d'informations sur l'héritage culturel - ISO 21127:2006 - 9-06

  • Uniform Resource Identifier (URI) : Generic Syntax - IETF RFC 3986 - 1-05

ANNEXES

  1. 1 Organismes

    1 Organismes

    American Memory http://memory.loc.gov/ammem/

    DAML http://www.daml.org

    DC, Dublin Core Metadata Initiative http://dublincore.org/

    DC, Dublin Core, Tools http://dublincore.org/groups/tools/

    DocBook http://www.docbook.org/

    DOI, Digital Object Identifier http://www.doi.org/

    EAD, Encoded Archival Description http://www.loc.gov/ead/

    Gallica, la bibliothèque numérique de la Bibliothèque nationale de France http://gallica.bnf.fr/

    HAL, Hyper Article en Ligne http://hal.archives-ouvertes.fr

    Handle, CNRI Handle System http://www.handle.net/

    IETF, Internet Engineering Task Force http://www.ietf.org

    LC, The Library of Congress http://www.loc.gov/

    MARC, Machine Readable Cataloging http://www.loc.gov/standards/

    METS, Metadata Encoding & Transmission Standard http://www.loc.gov/standards/mets

    MICHAEL, inventaire multilingue du patrimoine culturel européen http://www.michael-culture.org/

    OAI, Open Archives Initiative http://www.openarchives.org/

    OCLC, Online Computer Library Center http://www.oclc.org/

    PURL, Persistent Uniform Ressource Locator http://purl.net

    SCULPTEUR http://www.sculpteurweb.org

    SIMILE http://simile.mit.edu

    TEI, Text Encoding lnitiative http://www.tei-c.org/

    UNICODE, Universal Character enCoding http://www.unicode.org/

    W3C, World Wide Web Consortium http://www.w3.org/

    WebOut Working Group http://www.w3.org/2001/sw/WebOnt/

    ...
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 94 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Documents numériques Gestion de contenu"

    (66 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre

    Ressources documentaires

    XML et son écosystème

    Cet article traite de la structuration de fichiers XML, de la manière de les produire, de les utiliser, ...

    XML : syntaxe

    C’est une certitude, le langage XML est la nouvelle base du document numérique, grâce à ses nombreux ...