L'interopérabilité des systèmes vise à permettre une communication simplifiée entre les systèmes, afin de faciliter les échanges. Pour réaliser une telle interopérabilité, surtout dans un contexte hétérogène, XML (eXtensible Markup Language) [H 7 148] [H 3 500] s'impose aujourd'hui comme format d'échange, puisqu'il est indépendant des processus qui le produisent et l'utilisent. Il permet de structurer sémantiquement les données, et de rendre le contenu indépendant de toute mise en forme.
Si XML résout de nombreuses problématiques liées à l'échange de données, d'autres points relatifs à la gestion des contenus échangés sont à considérer. Quelques pistes sont fournies dans [H 3 502]. Notre but est ici de détailler les différents accès possibles aux données XML, en fonction des traitements que l'on souhaite réaliser.
L'accès aux données peut se faire via des outils de parcours de documents XML (parseur) de type DOM (Document Object Model) ou SAX (Simple API for XML), via un langage de transformation tel que XSL-T (eXtensible StyleSheet Language Transformation) ou encore directement via des requêtes XQuery. Le choix de l'accès doit bien sûr se faire en fonction des traitements nécessaires sur les documents, mais aussi en fonction du mode de stockage choisi.
À partir d'un cas d'étude exposé dans la partie 1 du document, nous détaillons trois solutions envisageables pour le stockage et le traitement de données provenant d'un document XML échangé entre deux systèmes (on suppose que la structure du document est connue).
La première serait d'utiliser une approche structurée pure : on stockerait les données XML dans des tables relationnelles, la transformation XML-relationnel se faisant via des approches de type événementiel (SAX), hiérarchique (DOM), ou par transformation (XSL-T) (partie 2).
La seconde serait d'utiliser une approche semi-structurée (XML) pure, et l'accès aux données se ferait directement via des requêtes XQuery (partie 3).
La dernière serait enfin d'adopter une approche mixte (base de données relationnelle avec type natif XML), dans laquelle l'accès aux documents XML utiliserait la puissance des bases de données relationnelles, sans dénaturer les documents, contrairement à la première solution (partie 4).
Pour chacune de ces solutions, nous fournissons des exemples d'implantation reposant sur les langages Java 1.5 et de PHP 5.0.