Xml par la pratique
1 - Generalites sur XML (1h)
Principes
XML
XML est un langage à balises ("markup language") utilisé pour transférer des données sur le web.
Documents XML bien formés
Chaque document XML a une structure logique et une structure physique.
Physiquement, le document se compose d'unités appelées entités.
Une entité peut contenir d'autres entités, qui sont alors incluses dans le document.
Un document commence à la « racine » ou entité document.
Logiquement, le document se compose de déclarations, d'éléments, de commentaires, d'appels de caractère et d'instructions de traitement, qui sont indiqués dans le document par du balisage explicite.
Les structures logiques et physiques doivent s'imbriquer correctement.
Les documents composés en XML obéissent tous à un certain nombres de règles pour être qualifiés de bien-formés : • Le document doit respecter les règles de conception décrites dans la recommandation du W3C sur XML, • Toutes les entités référencées dans le document doivent elles-mêmes être bien formées.
La suite de cette partie décrit les entités d'un document XML et les règles de conception de ce type de document.
Prologue XML
Chaque document XML doit commencer par une balise qui indique la version de XML utilisée et éventuellement d'autres indications.
Cette balise de début de document est appelée le prologue.
Exemple :
Texte
Les documents XML sont des fichiers textes.
Les caractères autorisés en XML sont la tabulation, le retour chariot, le retour à la ligne et les caractères Unicode et ISO/IEC 10646.
Le codage des caractères peut être effectué en UTF-8 et UTF-16.
Les caractères et & ne peuvent pas être employés, sauf pour délimiter une balise. (sauf exception, voir Sections CDATA)
Si on souhaite utiliser ces caractères, il est nécessaire d'employer des références à des entités de caractère : • & pour & • < pour < • > pour >
Pour employer ' et " dans