Zoeken…
Opmerkingen
Tekens kunnen worden ontsnapt in XML met behulp van entiteitsreferenties en tekenreferenties, of CDATA-secties.
XML definieert vooraf vijf entiteiten:
Benoemde entiteit | Vervangende tekst |
---|---|
amp | & |
quot | " |
apos | ' |
lt | < |
gt | > |
Het consumeren van applicaties zal niet weten of elk karakter is ontsnapt of niet, en hoe.
ampersand
Het &
-teken verschijnt eerst in entiteitsreferenties en moet worden ontsnapt in elementinhoud of in attribuutinhoud.
<?xml version="1.0"?>
<document attribute="An ampersand is escaped as &">
An ampersand can also be escaped as & in element content.
</document>
Lager dan bord
Het <
-teken wordt eerst weergegeven in entiteitstags en moet worden overgeslagen in elementinhoud of in kenmerkinhoud.
<?xml version="1.0"?>
<document attribute="A lower-than sign is escaped as <">
2 + 2 < 5
</document>
Groter dan-teken
De ]]>
tekenreeks is niet toegestaan in elementinhoud. De eenvoudigste manier om eraan te ontsnappen is om >
as >
.
<?xml version="1.0"?>
<document>
The sequence ]]> cannot appear in element content.
</document>
Apostrofen en citaten
Attribuutwaarden kunnen tussen eenvoudige of dubbele aanhalingstekens worden weergegeven. Het juiste karakter moet worden ontsnapt.
<?xml version="1.0"?>
<document
quot-attribute="This is a "double quote" and this one is 'simple'"
apos-attribute='This is a 'simple quote' and this one is "double"'>
</document>
CDATA-secties
Langere delen van tekst die speciale tekens bevatten, kunnen worden ontlopen met een CDATA-sectie. CDATA-secties kunnen alleen worden weergegeven in elementinhoud.
<?xml version="1.0"?>
<document>
This is a CDATA section : <![CDATA[ plenty of special characters like & < > " ; ]]>
</document>
Een CDATA-sectie kan de reeks niet bevatten ]]>
omdat deze eindigt.
Karakter referenties
Tekens kunnen worden ontsnapt met behulp van tekenreferenties, in elementinhoud of kenmerkwaarden. Hun Unicode-codepunt kan worden opgegeven in decimaal of hexadecimaal.
<?xml version="1.0"?>
<document>
The line feed character can be escaped with a decimal ( ) or hex (
)
representation of its Unicode codepoint (10).
</document>
XML beperkt tekens die in een document kunnen voorkomen, zelfs ontsnapt. In het bijzonder zijn de enige toegestane controletekens lijninvoer (10), wagenterugloop (13) of horizontale tab (9).