Buscar..
Observaciones
Los caracteres pueden escaparse en XML usando referencias de entidades y referencias de caracteres, o secciones CDATA.
XML pre-define cinco entidades:
Entidad nombrada | Texto de reemplazo |
---|---|
amperio | Y |
cotizar | " |
apos | ' |
es | < |
gt | > |
Las aplicaciones consumidoras no sabrán si cada personaje se ha escapado o no, y cómo.
Ampersand
El carácter &
aparece primero en las referencias de entidad y debe escaparse en el contenido del elemento o en el contenido del atributo.
<?xml version="1.0"?>
<document attribute="An ampersand is escaped as &">
An ampersand can also be escaped as & in element content.
</document>
Signo más bajo que
El <
carácter aparece primero en las etiquetas de entidad y debe escaparse en el contenido del elemento o en el contenido del atributo.
<?xml version="1.0"?>
<document attribute="A lower-than sign is escaped as <">
2 + 2 < 5
</document>
Signo mayor que
La secuencia de caracteres ]]>
no está permitida en el contenido del elemento. La forma más fácil de escapar es escapar >
como >
.
<?xml version="1.0"?>
<document>
The sequence ]]> cannot appear in element content.
</document>
Apóstrofes y citas
Los valores de los atributos pueden aparecer entre comillas simples o dobles. El personaje apropiado debe ser escapado.
<?xml version="1.0"?>
<document
quot-attribute="This is a "double quote" and this one is 'simple'"
apos-attribute='This is a 'simple quote' and this one is "double"'>
</document>
Secciones de CDATA
Las partes más largas del texto que contienen caracteres especiales pueden escaparse con una sección CDATA. Las secciones CDATA solo pueden aparecer en el contenido del elemento.
<?xml version="1.0"?>
<document>
This is a CDATA section : <![CDATA[ plenty of special characters like & < > " ; ]]>
</document>
Una sección CDATA no puede contener la secuencia ]]>
porque la termina.
Referencias de caracteres
Los caracteres pueden escaparse utilizando referencias de caracteres, en contenido de elementos o valores de atributos. Su punto de código Unicode se puede especificar en decimal o hexadecimal.
<?xml version="1.0"?>
<document>
The line feed character can be escaped with a decimal ( ) or hex (
)
representation of its Unicode codepoint (10).
</document>
XML restringe los caracteres que pueden aparecer en un documento, incluso escapados. En particular, los únicos caracteres de control permitidos son el salto de línea (10), el retorno de carro (13) o la pestaña horizontal (9).