Recherche…
Remarques
Les caractères peuvent être échappés en XML à l'aide de références d'entité et de références de caractères, ou de sections CDATA.
XML pré-définit cinq entités:
Entité nommée | Texte de remplacement |
---|---|
ampli | Et |
coté | " |
apos | ' |
lt | < |
gt | > |
Les applications consommatrices ne sauront pas si chaque personnage a été échappé ou non et comment.
Esperluette
Le caractère &
apparaît en premier dans les références d'entité et doit être échappé dans le contenu de l'élément ou dans le contenu de l'attribut.
<?xml version="1.0"?>
<document attribute="An ampersand is escaped as &">
An ampersand can also be escaped as & in element content.
</document>
Signe inférieur
Le caractère <
apparaît en premier dans les balises d’entité et doit être échappé dans le contenu de l’élément ou dans le contenu de l’attribut.
<?xml version="1.0"?>
<document attribute="A lower-than sign is escaped as <">
2 + 2 < 5
</document>
Signe supérieur à
La séquence de caractères ]]>
n'est pas autorisée dans le contenu de l'élément. La manière la plus simple de s'en échapper est de s'échapper >
as >
.
<?xml version="1.0"?>
<document>
The sequence ]]> cannot appear in element content.
</document>
Apostrophes et citations
Les valeurs d'attribut peuvent apparaître entre guillemets simples ou doubles. Le caractère approprié doit être échappé.
<?xml version="1.0"?>
<document
quot-attribute="This is a "double quote" and this one is 'simple'"
apos-attribute='This is a 'simple quote' and this one is "double"'>
</document>
Sections CDATA
De plus longues parties de texte contenant des caractères spéciaux peuvent être échappées avec une section CDATA. Les sections CDATA ne peuvent apparaître que dans le contenu de l'élément.
<?xml version="1.0"?>
<document>
This is a CDATA section : <![CDATA[ plenty of special characters like & < > " ; ]]>
</document>
Une section CDATA ne peut pas contenir la séquence ]]>
car elle la termine.
Références de personnage
Les caractères peuvent être échappés à l'aide de références de caractères, de contenu d'élément ou de valeurs d'attribut. Leur code Unicode peut être spécifié en décimal ou en hexadécimal.
<?xml version="1.0"?>
<document>
The line feed character can be escaped with a decimal ( ) or hex (
)
representation of its Unicode codepoint (10).
</document>
XML restreint les caractères pouvant apparaître dans un document, même échappé. En particulier, les seuls caractères de contrôle autorisés sont le saut de ligne (10), le retour chariot (13) ou la tabulation horizontale (9).