Всемирная паутина ( World Wide Web, Веб) [20] – распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету.
Всемирная паутина основывается на архитектуре клиент-сервер [21]. И на сервере, и на клиенте должно быть установлено дополнительное программное обеспечение – Веб-сервер и Веб-обозреватель соответственно. Это программное обеспечение поддерживает стандартный протокол передачи гипертекстов ( HTTP ), а также ряд других протоколов, в частности, протокол передачи файлов ( FTP ). Архитектура клиент-сервер означает, что взаимодействие пользовательского компьютера с Интернетом происходит следующим образом:
пользователь вводит адрес ( URI или URL ) Веб-документа, который он хочет просмотреть;
Веб-обозреватель формирует соответствующий HTTP -запрос к Веб-серверу;
Веб-сервер находит в Сети запрошенный документ и передает его обозревателю в качестве отклика на запрос (в конечном счете, Веб-сервер находит соответствующий файл на локальном жестком диске и отправляет его по сети запросившему компьютеру);
обозреватель интерпретирует полученный документ и отображает его пользователю (отображает гипертекст).
Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Такие URL -локаторы сочетают в себе технологию идентификации URI и систему доменных имен DNS (англ. Domain Name System ) – доменное имя (или непосредственно IP-адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее – одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.
Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссылки. Большая часть информации в Веб представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (HyperText Markup Language), язык разметки гипертекста. После HTML -разметки получившийся гипертекст помещается в файл. После того, как HTML -файл становится доступен веб-серверу, его начинают называть "веб-страницей". Набор веб-страниц образует веб-сайт. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удаленном сервере. Гиперссылки в Веб основаны на технологии URL.
В целом можно заключить, что Всемирная паутина стоит на "трех китах" [22, 23]:
язык гипертекстовой разметки документов HTML (HyperText Markup Language);
универсальный способ адресации ресурсов в сетиURL (Universal Resource Locator);
протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).
В последнее время HTML начал несколько сдавать свои позиции и уступать их более современным технологиям разметки: XHTML и XML [20]. XML (eXtensible Markup Language) позиционируется как фундамент для других языков разметки. Для улучшения визуального восприятия Веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц.
Популярная концепция развития сети Интернет – создание семантической паутины. Семантическая паутина – это надстройка над существующей Сетью, которая призвана сделать размещенную в ней информацию более понятной для компьютеров. О семантической паутине подробнее будет рассказано в 23 лекции.