Технология XML представляет собой протокол хранения и передачи информации. С другой стороны это семейство технологий позволяющее формировать различные документы и выполнять обработку информации.
При использовании XML разработчик создает документ с разметкой. Документ хранится в текстовом файле с расширением xml. Как и для создания HTML страниц разработку документов можно вести в любом текстовом редакторе поддерживающем кодировку ANSI.
Документ состоит из следующих основных частей: пролога и основной части.
В прологе документа располагаются директивы, необходимые интерпретатору XML для обработки документа. Директива начинается и заканчивается специальным символом ?. В прологе обязательно должна быть директива:
<?xml version="1.0" encoding="type"?>
В ней указывается версия XML и тип кодировки документа type. Для использования кириллицы применяются кодировки:
windows -1251 или ISO-8859-5.
Первая кодировки используется в текстовых редакторах операционной системы Windows и ее использование предпочтительнее.
Основная часть документа следует за прологом. Эта часть документа содержит собственно разметку. Разметка XML - выделение структурных составляющих документа тегами. Разработчик документа сам выбирает названия тегов по смыслу документа. Для названия тегов используются латинские символы.
Разметка должна отвечать определенным правилам. Ниже рассмотрены эти правила.
Теги в документе могут быть двух типов:
Парные:
<name>информация</name>
Одиночные:
<name/>
Здесь name - наименование тега.
Документ должен отвечать следующим требованиям:
· содержать корневой тег;
· внутри корневого тега должны располагаться дочерние;
· в дочерний тег может вкладываться другой,
· число вложений не ограничено;
· теги должны быть замкнуты, если они парные;
· регистр символов в парных тегах должен совпадать;
· пересечение тегов не допускается.
Соблюдение перечисленных правил необходимо что бы получить «корректно форматированный документ».
Пример корректного XML документа:
<?xml version="1.0" encoding="windows-1251"?>
<TEST>
<NODE>
<ENG>Hello World !</ENG>
<RU>Привет МИР !</RU>
</NODE>
</TEST>
На рисунке 2.5 показана его структура.
Рис.2.5. Структура документа
Документ XML представляет собой иерархическую структуру.
В начале иерархии располагается корневой элемент (не путать с корневым тегом !). Это начало документа, его пролог. Затем располагается корневой тег, который содержит остальные теги разметки это тег TEST. Он содержит тег NODE, который содержит два тега ENG и RU. Содержание двух последних тегов сообщения на английском и русском языках.
Если сохранить рассмотренную разметку документа в текстовый файл hello.xml и загрузить в браузер то она отобразиться и иерархическом виде, так как это показано на рисунке 2.6. Рядом с тегами выводится пиктограмма + или - . Знак - означает что тег раскрыт и видно его содержания, его можно закрыть сделав на пиктограмме щелчок мышью.
Рис.2.6. Документ в браузере MS Internet Explorer
Следует иметь в виду, что браузер отображает только корректные XML документы, если документ содержит ошибку в разметке, то выводится сообщение об ошибке и загрузка прекращается. Например, в закрывающем теге </ENG> изменим регистр первого символа </eNG> и повторим загрузку. Вид окна браузера показан на рисунке 2.7.