Поиск…
замечания
Символы могут быть экранированы в XML, используя ссылки на объекты и ссылки на символы, или разделы CDATA.
XML предопределяет пять объектов:
Именованный объект | Текст замены |
---|---|
ампер | & |
Quot | " |
APOS | ' |
л | < |
GT | > |
Потребляющие приложения не будут знать, сбежал ли каждый символ или нет, и как.
амперсант
Символ &
появляется сначала в ссылках на сущности и должен быть экранирован в содержимом элемента или в содержимом атрибута.
<?xml version="1.0"?>
<document attribute="An ampersand is escaped as &">
An ampersand can also be escaped as & in element content.
</document>
Знак ниже, чем знак
Символ <
сначала появляется в тегах сущностей и должен быть экранирован в содержимом элемента или в содержимом атрибута.
<?xml version="1.0"?>
<document attribute="A lower-than sign is escaped as <">
2 + 2 < 5
</document>
Больше, чем знак
Последовательность символов ]]>
не допускается в содержимом элемента. Самый простой способ избежать этого - выйти >
как >
,
<?xml version="1.0"?>
<document>
The sequence ]]> cannot appear in element content.
</document>
Апострофы и цитаты
Значения атрибутов могут отображаться в простых или двойных кавычках. Соответствующий символ должен быть экранирован.
<?xml version="1.0"?>
<document
quot-attribute="This is a "double quote" and this one is 'simple'"
apos-attribute='This is a 'simple quote' and this one is "double"'>
</document>
Секции CDATA
Более длинные части текста, содержащие специальные символы, могут быть экранированы с помощью секции CDATA. Секции CDATA могут отображаться только в содержимом элемента.
<?xml version="1.0"?>
<document>
This is a CDATA section : <![CDATA[ plenty of special characters like & < > " ; ]]>
</document>
Раздел CDATA не может содержать последовательность ]]>
потому что он заканчивается.
Ссылки на символы
Символы могут быть экранированы с использованием ссылок на символы, в содержании элементов или значениях атрибутов. Их код Unicode может быть указан десятичным или шестнадцатеричным.
<?xml version="1.0"?>
<document>
The line feed character can be escaped with a decimal ( ) or hex (
)
representation of its Unicode codepoint (10).
</document>
XML ограничивает символы, которые могут отображаться в документе, даже экранированные. В частности, допускаются только допустимые управляющие символы: подача строки (10), возврат каретки (13) или горизонтальная вкладка (9).