Langage xml

Disponible uniquement sur Etudier
  • Pages : 7 (1507 mots )
  • Téléchargement(s) : 0
  • Publié le : 8 juin 2011
Lire le document complet
Aperçu du document
Note de synthèse : Quel analyseur XML utiliser ?

1.

Le langage XML

XML (Extensible Marquage Language) est un langage informatique de balisage générique. C’est un ensemble de conventions pour la conception de formats texte permettant de structurer des données. Il constitue une technique pour l’organisation, l’affichage et la gestion des données. Combinées avec un le modèle objet dedocument standardisé (DOM), cette est indispensable pour utilisation d’un langage de balises sur le Web. Cette note de synthèse présentera les philosophies des interfaces SAX et DOM dans le traitement des documents XML. Ensuite, nous expliquerons comment sont réalisées les traitements (ajout, suppression, mise à jour, recherche, etc.) dans un document XML basées sur les interfaces SAX et DOM. Puis nousétudierons le résultat sous forme de représentation arborescente renvoyé avec l’analyseur SAX et DOM sur un exemple. Et pour conclure, nous identifierons les principales limitations de l’interface DOM et SAX.

2.

L’interface DOM

DOM (Modèle Objet Document) est une spécification du W3C (World Wide Web Consortium). C’est une interface de programmation d’applications (API) pour documents XML ,permettant à des programmes informatiques et à des scripts d’accéder ou de mettre à jour dynamiquement le contenu, la structure ou le style de documents XML. DOM permet de définir la structure d’un document sous la forme d’une hiérarchie d’objet afin de simplifier l’accès aux éléments d’un document. Il parcourt et mémorise l’intégralité du document avant de pouvoir effectuer les traitementsvoulus. Par exemple le DOM offre la possibilité de créer des documents et des fragments de documents, de naviguer dans le document, de copier et de supprimer des fragments de documents, d’ajouter ou de modifier des attributs. Nous aborderons dans la prochaine partie ces possibilités offertes par DOM. La spécification DOM est définie niveau par niveau. En effet il existe trois types de spécifications •La spécification DOM level 1 qui se séparent en deux catégories Core DOM level 1: La spécification pour les documents en général (dont XML) HTML DOM level 1: La spécification retenant uniquement les méthodes applicables à HTML • La spécification DOM level 2 ajoute de nouvelles fonctionnalités.

Note de synthèse : Quel analyseur XML utiliser ? L’objectif de cet ensemble de recommandations est defournir des outils de haut niveau permettant d’accéder et de manipuler un document XML. Cela constitue une différence notable avec SAX qui s’intéresse uniquement aux événements. Les principales interfaces fournit avec la spécification DOM level 1 sur les documents XML sont les suivantes :

Interface Node C’est l’interface fondamentale du DOM. Presque tous les objets abordés ici étendent lesfonctionnalités de cette interface, ce qui est logique puisque tout élément d’un document XML est un nœud. Il représente un nœud unique de l'arbre du document. Bien que tous les objets implémentant l'interface Node fournissent des méthodes pour traiter leurs enfants, tous les objets implémentant l'interface Node n'ont pas forcement d'enfants.

Interface Document Elle représente tout le documentXML. Elle hérite de l’interface Node ce qui signifie que les propriétés et les méthodes de Node sont également disponibles dans un objet Document. Conceptuellement, il s'agit de la racine de l'arbre du document, et fournit l'accès principal aux données du document.

Interface Attribut Elle représente un attribut d'un objet de type Elément. Typiquement, les valeurs autorisées de l'attribut sontspécifiées dans une DTD (Définition de Type de Document). Les objets Attr héritent de l'interface NODE, mais comme ils ne sont pas vraiment des noeuds enfants de l'élément qu'ils décrivent, le Modèle Objet de Document DOM ne les considère pas comme partie intégrante de l'arbre.

Interface Elément Les objets les plus couramment rencontrés par les utilisateurs parcourant un document (mis à part le...
tracking img