XML, SGML et HTML : perspective historique
XML
H7148 v1 Article de référence

XML, SGML et HTML : perspective historique
XML

Auteur(s) : François CHAHUNEAU

Date de publication : 10 nov. 2001 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Présentation de XML

2 - XML, SGML et HTML : perspective historique

3 - Syntaxe du langage XML

  • 3.1 - Constituants syntaxiques du balisage XML
  • 3.2 - Domaines nominaux (namespaces)
  • 3.3 - Notion de document XML « bien formé » (well-formed)

4 - Modèles de données : DTD et schémas

5 - Domaines d’application de XML

  • 5.1 - Vertus cardinales de XML
  • 5.2 - XML et les applications documentaires
  • 5.3 - XML et les échanges de données entre applications
  • 5.4 - XML et les applications Web « client-side »

6 - Autres normes et standards associés à XML ou dérivés de XML

7 - Outils XML

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

XML (eXtensible Markup Language) est une méthode universelle de représentation textuelle de données structurées selon une syntaxe normalisée. XML a été conçu pour permettre d’échanger et de stocker des données indépendamment des programmes ou des processus qui les produisent, et de les produire indépendamment des programmes ou des processus qui les utilisent.

La notion de représentation sous forme textuelle, c’est-à-dire sous la forme séquentielle d’un flux de caractères balisé, s’oppose ici à celle de représentation binaire. XML a été développé sous l’égide du World Wide Web Consortium (W3C) depuis fin 1996 ; le langage XML, c’est-à-dire l’ensemble des règles de syntaxe régissant la représentation balisée de l’information, est défini très précisément dans une recommandation du W3C [1] dont la version 1.0 est datée du 10/02/98. (Une seconde édition de cette spécification, corrigeant certaines erreurs rédactionnelles, a été publiée le 6/10/00).

Par convention, on appelle document XML le résultat de cette représentation, même dans les cas où le flux textuel balisé n’a aucun caractère narratif et n’est en rien destiné à être appréhendé par un lecteur humain après mise en forme sur un média. Si XML a de nombreuses applications dans le monde documentaire, héritées de son ancêtre SGML [2], il est également applicable à une large variété de problèmes concernant la représentation, l’échange et le traitement de données structurées hors du champ documentaire. On peut utiliser XML pour représenter un extrait de base de données, une feuille de calcul, l’ensemble des paramètres de configuration d’une application informatique, les flux de données échangés lors de transactions financières, les données complexes d’un système d’information géographique, des graphiques, etc. XML a ainsi vocation à devenir le format d’échange universel pour les flux de données structurées qui transiteront, dans des volumes sans cesse croissants, sur le World Wide Web.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7148

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

2. XML, SGML et HTML : perspective historique

2.1 XML et SGML

XML est directement dérivé de SGML (Standard Generalized Markup Language), le langage générique de balisage conçu au début des années 1980 et adopté en 1986 comme norme ISO sous la référence ISO 8879 qui a subi depuis divers amendements. La spécification W3C elle-même définit XML comme « un sous-ensemble de SGML dont le but est de permettre au SGML générique d’être transmis, reçu et traité sur le Web de la même manière que l’est HTML aujourd’hui ».

XML ne constitue donc nullement, dans son principe de base, une nouveauté technologique conçue vers la fin des années 1990, comme l’a implicitement suggéré le phénomène de mode qui a accompagné sa découverte, puis son adoption par la communauté technique du Web. Cependant, alors que l’usage de SGML était essentiellement confiné au domaine des applications documentaires lourdes nécessitant une structuration logique des documents pour permettre leur manipulation informatique, XML a vu sa sphère d’application s’étendre bien au-delà du domaine documentaire. Une partie de ce succès s’explique par un certain de nombre de simplifications, de rationalisations et de clarifications pertinentes apportées à XML par rapport à SGML, ainsi que quelques extensions nécessaires.

Le concept de modélisation logique d’une structure de données par emboîtement d’éléments typés dotés d’attributs et de sa représentation par un flux de caractères entrelaçant données textuelles et balisage est intégralement présent dans SGML. Il en va de même pour la notion de typage des composants documentaires en fonction de leur nature et non de leur présentation, selon un vocabulaire défini par le concepteur d’application. Enfin, SGML a introduit la notion de modèle générique pour la structure logique d’un document, sous la forme de définition de type de document (DTD).

Pourtant, certaines caractéristiques de SGML, initialement conçues comme des perfectionnements augmentant la puissance du langage, semblent, avec le recul, avoir limité son succès. Ces caractéristiques ont donc été volontairement omises dans la définition de XML (pour un examen détaillé des différences entre les spécifications SGML et XML, on se reportera à [5]...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
XML, SGML et HTML : perspective historique

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

La masse d’information disponible sur XML est considérable, qu’il s’agisse d’ouvrages, d’articles ou d’information en ligne. Les ouvrages actuellement disponibles couvrent tout le spectre qui s’étend des ouvrages introductifs jusqu’aux guides avancés pour programmeurs portant sur les normes et standards, les outils et les API.

Parmi les sites Internet les plus intéressants, on retiendra les trois suivants, qui jouent un rôle de portail d’entrée dans le monde XML.

http://www.oasis-open.org/cover/xml.html : ce site, maintenu par Robin Cover, tente de répertorier et de classifier l’ensemble de l’information disponible en ligne sur XML. Il liste notamment un très grand nombre d’applications XML, dans le secteur académique comme dans le secteur privé, qui donneront une idée de la variété des domaines d’applications actuels.

http://www.xmlsoftware.com : c’est le portail du logiciel XML. La plupart des outils disponibles sont classifiés et brièvement présentés, qu’il s’agisse de progiciels commerciaux, d’outils du domaine public, ou de prototypes de la boratoire. Des liens permettent d’accéder aux sites des entreprises ou des institutions qui développent ces outils.

http://msdn.microsoft.com/xml/default.asp : la partie du site Microsoft consacrée à XML est riche d’informations, et propose notamment des tutoriels en ligne de bonne qualité pédagogique et de portée plus générale que le...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Documents mathématiques - Besoins et outils

Les besoins de la notation mathématique sont couverts depuis un certain temps déjà par les langages ...

Documents mathématiques - Norme MathML

MathML a été conçu pour décrire la présentation et la logique d'une expression mathématique. Il est ...

XML : syntaxe

C’est une certitude, le langage XML est la nouvelle base du document numérique, grâce à ses nombreux ...

Métadonnées, ontologies et documents numériques

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe ...