Présentation

Article

1 - PROJET DU WEB SÉMANTIQUE WEB SÉMANTIQUE COMME EXTENSION DU WEB ACTUEL

2 - REPRÉSENTATION SÉMANTIQUE DES CONTENUS

3 - LANGAGES DU WEB SÉMANTIQUE

4 - CONCLUSION

Article de référence | Réf : H7502 v1

Représentation sémantique des contenus
Web sémantique - Principes, représentations sémantiques et ontologies

Auteur(s) : Philippe LAUBLET

Date de publication : 10 mai 2010

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

RÉSUMÉ

Le Web sémantique propose dorénavant un saut qualitatif par rapport au Web actuel. Il permet de connecter différentes ressources du Web (documents et données, au sens large) par des liens sémantiques en construisant ainsi des graphes de connaissances structurés. Ceux-ci sont ensuite exploitables pour différentes tâches, en déployant ces structures et la sémantique ainsi créée. Le modèle de représentation RDF (Resource Description Framework) aide à réaliser aisément cette approche dans le Web distribué. La standardisation de ce modèle, mais aussi celle des vocabulaires décrivant les notions utilisées, permettent d'obtenir une interopérabilité généralisée. Les ontologies, au sens de l'ingénierie des connaissances, jouent alors un rôle majeur. Ces notions de Web sémantique et d'ontologie sont ainsi étroitement liées.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

The semantic Web offers qualitative advantages compared to the current Web. It allows for connecting various Web sources (documents and data, in the broad sense of the term) via semantic links thus building structured knowledge graphs. These graphs can then be exploited for various tasks, by deploying these structures and the semantics thus created. The RDF (Resource Description Framework)representation model assists in carrying out this approach in the distributed Web. The standardization of this model, as well as that of the vocabulary describing the notions used, allow for a generalized interoperability. Ontologies, in the sense of knowledge engineering, then play a major role. These notions of semantic Web and ontology are therefore closely linked.

Auteur(s)

  • Philippe LAUBLET : Maître de conférences à l'université Paris-Sorbonne (Paris-4)

INTRODUCTION

En 1989, Tim Berners-Lee, futur fondateur du W3C, imagine pour le CERN, une organisation novatrice des ressources internes sous forme d'un réseau informatique distribué. La structure proposée est celle d'un graphe dont les nœuds représentent les ressources (personnes, groupes de personnes, projets, concepts, documents, objets du hardware, entités de natures diverses) et les arcs des liens étiquetés connectant les nœuds. Des exemples d'étiquettes proposées, en 1989, sont : dépend de, est partie de, réalise, réfère à, utilise, est un exemple de... Cette vision, reprenant la notion d'hypertexte est à l'origine du Web. Pourtant, malgré la rapidité de son expansion avec un nombre impressionnant de sites et d'utilisateurs, le Web actuel ne reflète qu'imparfaitement la vision initiale. Le Web ne connecte que des documents (nœuds non typés) et les liens eux-mêmes ne sont pas munis d'étiquettes typées. Les utilisateurs humains ont appris à faire avec ces limitations en s'appuyant sur leur compréhension du contenu des documents connectés et en attribuant, si possible, un sens aux liens à l‘aide du texte des ancres. Par contre, ces capacités restent largement inaccessibles aux logiciels faute d'une sémantique interprétable par les machines.

L'initiative du Web sémantique (WS), impulsée par le W3C, propose un saut qualitatif à partir du Web actuel qui, d'une certaine manière, reprend la vision originelle de Berners-Lee. Pour reprendre Berners-Lee et al. dans The Semantic Web, « le Web sémantique est une extension du Web actuel dans laquelle l'information est munie d'une signification bien définie, permettant aux ordinateurs et aux personnes de mieux travailler en coopération ».

Les promoteurs du WS proposent la construction systématique d'un niveau supplémentaire de description explicite des ressources et des liens pour une meilleure utilisation par les machines. Ce niveau spécifique de représentation est composé de ce qu'il est souvent convenu d'appeler des métadonnées ou annotations sémantiques. Il obéit à un modèle de graphe simple, le modèle RDF (cf. § 2.1), qui permet de lier sémantiquement les ressources. Mais il permet aussi des représentations complexes. Dans la suite, ressource signifie tout ce qui peut être identifié par une URI (Uniform Ressource Identifier). Ces URIs ont deux rôles, le premier d'identification, le second d'adressage (lié à un protocole dans le cas des URL), donc, dans ce cas, de localisation et d'accès. Ainsi, ressource, donnée au sens large, signifie aussi bien un livre ou un document, un lieu géographique, une notion dans un schéma conceptuel mais bien sûr aussi une page Web ou une partie de cette page, en fait toute donnée manipulée à travers son URI et ses représentations (cf. pour des exemples la note en § 2.1).

Les réalisations WS doivent le plus souvent s'appuyer sur des vocabulaires logiques standardisés pour des communautés d'utilisateurs ou même à l'échelle du Web tout entier. Dans le cas du WS, ces vocabulaires découlent d'ontologies dans un sens que nous préciserons dans la section 2.4.

À partir de ce socle commun, de nombreuses technologies ont été construites. Intéressantes en tant que telles, elles trouvent leur emploi aujourd'hui, d'une part dans des projets qui structurent et connectent des parties de plus en plus importantes du Web, comme de vastes projets en biologie ou bien encore l'initiative « Linking Open Data »  (cf. WS II), d'autre part dans des applications d'entreprise déployées « localement » (cf. WS II).

Bien sûr, les perspectives ouvertes par le WS ne sont pas simplement technologiques, mais elles sont aussi sociales et économiques. Elles peuvent modifier et enrichir beaucoup d'activités individuelles et collectives, particulièrement coopératives, en facilitant la production, l'accès et l'exploitation des ressources numériques dans leur diversité.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7502


Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(73 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

2. Représentation sémantique des contenus

2.1 Modèle de base

Les tâches fixées au WS sont d'abord rendues possibles par la mise en place d'une couche sémantique permettant la description des ressources. Le modèle de base pour formaliser ces descriptions est proposé, par le W3C, sous le nom de modèle RDF (Resource Data Framework ). Il est à la sémantique des données ce qu'HTML est à la présentation des documents et XML à la description balisée des documents et se veut aussi simple. Il permet de construire ces représentations sous forme d'un ensemble de triplets « sujet/propriété/objet ». Ces triplets forment ce que l'on appelle des graphes RDF (cf. figure 1). Un sujet est une ressource comme définie précédemment. L'objet, au sens des triplets RDF, est en général aussi une ressource, ou éventuellement un littéral, valeur d'un type de donnée simple comme une chaîne de caractères (souvent on utilisera les types de données XML). L'utilisation de la notion d'URI permet de retrouver les connaissances portant sur le même objet quelle que soit leur place sur le réseau. En d'autres termes, deux graphes disposés dans deux entrepôts de données différents qui possèdent deux nœuds étiquetés par la même URI pourront donner lieu à des utilisations et, en premier lieu, à des interrogations qui utiliseront les connaissances de ces deux graphes. On peut alors parler de fusion de graphes, virtuelle ou réelle (par importation dans ce cas).

Nota :

exemples d'URI repris en bonne partie des présentations d'Ivan Herman responsable de l'activité WS au W3C : une URI pour un livre : son numéro ISBN http://.../isbn/2020386682 ; pour une notion dans un schéma conceptuel sa référence dans le fichier de définition du schéma http://.../bookSchema.rdf#Université ; pour un lieu géographique, sa référence unique dans la base Géonames http://sws.geonames.org/2759793. On pourra aussi écrire que l'objet de la référence est le même que celui correspondant à une certaine URI en DBPedia owl:sameAs http://dbpedia.org/resource/Amsterdam ou bien encore qu'Amsterdam est dans les Pays-bas geo:inCountry http://www.geonames.org/...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(73 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Représentation sémantique des contenus
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - BERNERS-LEE (T.), HENDLER (J.), LASSILA (O.) -   The Semantic Web.  -  Scientific American, p. 34-43, mai 2001.

  • (2) - BIZER (C.), HEATH (T.), BERNERS-LEE (T.) -   Linked Data. The story so far.  -  IJSWIS, vol. 5, Issue 3, p. 1-22 (2009).

  • (3) - LAUBLET (P.), REYNAUD (C.), CHARLET (J.) -   Sur quelques aspects du Web sémantique. Assises du GDR I3.  -  Éditions Cépaduès, Nancy (2002).

  • (4) - USCHOLD (M.) -   Where are the semantics in the Semantic Web.  -  AI Magazine, Fall, 24(3) (2003).

  • (5) - BERNERS-LEE (T.) -   Le Web va changer de dimension.  -  La Recherche, p. 34-38, nov. 2007.

  • (6) - DOERR (M.), HUNTER (J.), LAGOZE (K.) -   Toward a Core Ontology for Information Integration.  -  Journal of Digital Information, vol. 4, no 1 (2003).

  • ...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(73 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS