Syntaxe du langage XML
XML
H7148 v1 Article de référence

Syntaxe du langage XML
XML

Auteur(s) : François CHAHUNEAU

Date de publication : 10 nov. 2001 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Présentation de XML

2 - XML, SGML et HTML : perspective historique

3 - Syntaxe du langage XML

  • 3.1 - Constituants syntaxiques du balisage XML
  • 3.2 - Domaines nominaux (namespaces)
  • 3.3 - Notion de document XML « bien formé » (well-formed)

4 - Modèles de données : DTD et schémas

5 - Domaines d’application de XML

  • 5.1 - Vertus cardinales de XML
  • 5.2 - XML et les applications documentaires
  • 5.3 - XML et les échanges de données entre applications
  • 5.4 - XML et les applications Web « client-side »

6 - Autres normes et standards associés à XML ou dérivés de XML

7 - Outils XML

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

XML (eXtensible Markup Language) est une méthode universelle de représentation textuelle de données structurées selon une syntaxe normalisée. XML a été conçu pour permettre d’échanger et de stocker des données indépendamment des programmes ou des processus qui les produisent, et de les produire indépendamment des programmes ou des processus qui les utilisent.

La notion de représentation sous forme textuelle, c’est-à-dire sous la forme séquentielle d’un flux de caractères balisé, s’oppose ici à celle de représentation binaire. XML a été développé sous l’égide du World Wide Web Consortium (W3C) depuis fin 1996 ; le langage XML, c’est-à-dire l’ensemble des règles de syntaxe régissant la représentation balisée de l’information, est défini très précisément dans une recommandation du W3C [1] dont la version 1.0 est datée du 10/02/98. (Une seconde édition de cette spécification, corrigeant certaines erreurs rédactionnelles, a été publiée le 6/10/00).

Par convention, on appelle document XML le résultat de cette représentation, même dans les cas où le flux textuel balisé n’a aucun caractère narratif et n’est en rien destiné à être appréhendé par un lecteur humain après mise en forme sur un média. Si XML a de nombreuses applications dans le monde documentaire, héritées de son ancêtre SGML [2], il est également applicable à une large variété de problèmes concernant la représentation, l’échange et le traitement de données structurées hors du champ documentaire. On peut utiliser XML pour représenter un extrait de base de données, une feuille de calcul, l’ensemble des paramètres de configuration d’une application informatique, les flux de données échangés lors de transactions financières, les données complexes d’un système d’information géographique, des graphiques, etc. XML a ainsi vocation à devenir le format d’échange universel pour les flux de données structurées qui transiteront, dans des volumes sans cesse croissants, sur le World Wide Web.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7148

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

3. Syntaxe du langage XML

L’objet de ce paragraphe est de résumer les aspects les plus importants de la syntaxe de balisage des instances XML, à l’exclusion de la syntaxe des déclarations qui constituent le prologue. La terminologie française adoptée ici pour les termes techniques XML est celle utilisée dans la traduction française de la norme XML (http://babel.alis.com/web_ml/xml). Pour une définition formelle et exhaustive de la syntaxe du langage, on se reportera à la spécification W3C [1].

3.1 Constituants syntaxiques du balisage XML

HAUT DE PAGE

3.1.1 Représentation des caractères en XML

XML étant une méthode de représentation textuelle de données structurées, la représentation des caractères eux-mêmes (constituants à la fois du balisage et des données textuelles) revêt une importance essentielle.

Né à l’ère de l’internationalisation des contenus liée au Web, XML a adopté d’emblée comme référence le jeu de caractères défini par la norme ISO 10646/Unicode.

Nota :

le lecteur se reportera à l’article Codage des caractères . La norme ISO/IEC 10646 et le standard Unicode définissent des jeux de caractères strictement identiques pour les caractères codables sur 16 bits (« Basic Multilingual Plane » de l’ISO 10646), soit la totalité des 47 000 caractères (environ) actuellement définis. Les deux standards peuvent être considérés comme identiques pour les besoins courants d’usage de XML.

Les caractères présents dans un document XML sont supposés être représentés par l’un des encodages standards de l’ISO 10646/Unicode : encodage UTF-8, basé ASCII et utilisant des octets de 8 bits, ou encodage UTF-16 (alias UCS-2) sur 16 bits. La norme XML stipule que tous les processeurs doivent être à même de traiter des documents XML encodés en UTF-8 ou en UTF-16. Ils peuvent savoir traiter optionnellement d’autres encodages couramment et traditionnellement utilisés...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Syntaxe du langage XML

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

La masse d’information disponible sur XML est considérable, qu’il s’agisse d’ouvrages, d’articles ou d’information en ligne. Les ouvrages actuellement disponibles couvrent tout le spectre qui s’étend des ouvrages introductifs jusqu’aux guides avancés pour programmeurs portant sur les normes et standards, les outils et les API.

Parmi les sites Internet les plus intéressants, on retiendra les trois suivants, qui jouent un rôle de portail d’entrée dans le monde XML.

http://www.oasis-open.org/cover/xml.html : ce site, maintenu par Robin Cover, tente de répertorier et de classifier l’ensemble de l’information disponible en ligne sur XML. Il liste notamment un très grand nombre d’applications XML, dans le secteur académique comme dans le secteur privé, qui donneront une idée de la variété des domaines d’applications actuels.

http://www.xmlsoftware.com : c’est le portail du logiciel XML. La plupart des outils disponibles sont classifiés et brièvement présentés, qu’il s’agisse de progiciels commerciaux, d’outils du domaine public, ou de prototypes de la boratoire. Des liens permettent d’accéder aux sites des entreprises ou des institutions qui développent ces outils.

http://msdn.microsoft.com/xml/default.asp : la partie du site Microsoft consacrée à XML est riche d’informations, et propose notamment des tutoriels en ligne de bonne qualité pédagogique et de portée plus générale que le...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Documents mathématiques - Besoins et outils

Les besoins de la notation mathématique sont couverts depuis un certain temps déjà par les langages ...

Documents mathématiques - Norme MathML

MathML a été conçu pour décrire la présentation et la logique d'une expression mathématique. Il est ...

XML : syntaxe

C’est une certitude, le langage XML est la nouvelle base du document numérique, grâce à ses nombreux ...

Métadonnées, ontologies et documents numériques

L'arrivée du XXIe siècle coïncide avec une explosion du volume des informations numériques qu’il importe ...