Сетевые технологии устраняют барьеры, ограничивающие наш разум, примером этому могут служить две авторские технологии: гипертекст и мультимедиа.
Одним из первых инструментальных средств создания технологии мультимедиа явилась гипертекстовая технология, которая обеспечивает работу с текстовой информацией, изображением, звуком, речью.
В 1945 г. Ваневар Буш, научный советник президента Трумена, проанализировав способы представления информации в виде отчетов, докладов, проектов, графиков, планов и поняв неэффективность такого представления, предложил способ размещения информации по принципу ассоциативного мышления. На базе этого принципа была разработана модель гипотетической машины МЕМЕКС. Через 20 лет Теодор Нельсон реализовал этот принцип на ЭВМ и назвал его гипертекстом.
Обычно любой текст представляется как одна длинная строка символов, которая читается в одном направлении. Гипертекстовая технология заключается в том, что текст представляется как многомерный, т.е. с иерархической структурой типа сети. Материал текста делится на фрагменты. Каждый видимый на экране ЭВМ фрагмент, дополненный многочисленными связями с другими фрагментами, позволяет уточнить информацию об изучаемом объекте и двигаться в одном или нескольких направлениях по выбранной связи.
Гипертекст обладает нелинейной сетевой формой организации материала, разделенного на фрагменты, для каждого из которых указан переход к другим фрагментам по определенным типам связей. При установлении связей можно опираться на разные основания (ключи), но в любом случае речь идет о смысловой (семантической) близости связываемых фрагментов. Следуя указанным связям, можно читать или осваивать материал в любом порядке, а не в единственном. Текст теряет свою замкнутость, становится принципиально открытым, в него можно вставлять новые фрагменты, указывая для них связи с имеющимися фрагментами. Структура текста не разрушается, и вообще у гипертекста нет априорно заданной структуры. Таким образом, гипертекст - это новая технология представления неструктурированного свободно наращиваемого знания. Этим он отличается от других моделей представления информации.
Под гипертекстом понимают систему информационных объектов (статей), объединенных между собой направленными связями, образующими сеть.
Каждый объект связывается с информационной панелью экрана, на которой пользователь может ассоциативно выбирать одну из связей. Объекты не обязательно должны быть текстовыми, они могут быть графическими, музыкальными, с использованием средств мультипликации, аудио- и видеотехники. Обработка гипертекста открывает новые возможности освоения информации, качественно отличающиеся от традиционных. Вместо поиска информации по соответствующему поисковому ключу гипертекстовая технология предполагает перемещение от одних объектов информации к другим с учетом их смысловой (семантической) связанности. Обработке информации по правилам формального вывода в гипертекстовой технологии соответствует запоминание пути перемещения по гипертекстовой сети.
Гипертекстовая технология ориентирована на обработку информации не вместо человека, а вместе с человеком, т.е. становится авторской. Удобство ее использования состоит в том, что пользователь сам определяет подход к изучению или созданию материала с учетом своих индивидуальных способностей, знаний, уровня квалификации и подготовки. Гипертекст содержит не только информацию, но и аппарат ее эффективного поиска. По глубине формализации информации гипертекстовая технология занимает промежуточное положение между документальными и фактографическими информационными системами.
Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.
Информационный материал подразделяется на информационные статьи, состоящие из заголовка, статьи и текста. Заголовок содержит тему или наименование описываемого объекта. Информационная статья содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим, близким по смыслу статьям. Текст, включаемый в информационную статью, может сопровождаться пояснениями, примерами, документами, объектами реального мира. Беглый просмотр текста статьи упрощается, если эта вспомогательная информация визуально отличается от основной, например подсвечена или выделена другим шрифтом.
Тезаурус гипертекста - это автоматизированный словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка и предназначенный для поиска слов по их смысловому содержанию.
Термин «тезаурус» был введен в XIII в. флорентийцем Брунетто Лотики для названия энциклопедии. С латыни этот термин переводится как «сокровище, запас, богатство». Тезаурус гипертекста состоит из тезаурусных статей. Тезаурусная статья имеет заголовок и список заголовков родственных тезаурусных статей, где указаны тип родства и заголовки тезаурусных статей. Заголовок тезаурусной статьи совпадает с наименованием информационной статьи и является наименованием объекта, описание которого содержится в информационной статье. В отличие от традиционных тезаурусов-дескрипторов тезаурус гипертекста содержит не только простые, но и составные наименования объектов. Формирование тезаурусной статьи гипертекста означает индексирование текста [35].
Полнота связей, отражаемых в тезаурусной статье, и точность установления этих связей, в конечном итоге, определяют полноту и точность поиска при обращении к данной статье гипертекста. Существуют следующие типы родства, или отношений: вид-род, род-вид, предмет-процесс, процесс-предмет, целое-часть, часть-целое, причина-следствие, следствие-причина и т.д. Пользователь получает более общую информацию по родовому типу связи, а по видовому - специфическую информацию без повторения общих сведений из родовых тем. Тем самым глубина индексирования текста зависит от родовидовых отношений. Список заголовков родственных тезаурусных статей представляет собой локальный справочный аппарат, в котором указываются ссылки только на ближайших родственников. Тезаурус гипертекста можно представить в виде сети - в узлах находятся текстовые описания объекта (информационные статьи), ребра сети указывают на существование связи между объектами и на тип родства. В гипертексте поисковый аппарат не делится на тезаурус и массив поисковых образов-документов, как в обычных информационно-поисковых системах. В гипертексте весь поисковый аппарат реализуется как тезаурус гипертекста.
Список главных тем содержит заголовки всех справочных статей, для которых нет ссылок с отношениями ни род-вид, ни часть-целое. Желательно, чтобы список занимал не более одной панели экрана.
Алфавитный словарь содержит перечень наименований всех информационных статей в алфавитном порядке.
Гипертекст используется для предоставления какой-либо информации в виде ссылок на другие темы или документы.
Гипертексты, составленные вручную, используются давно, это справочники, энциклопедии, а также словари, снабженные развитой системой ссылок. Область применения гипертекстовых технологий очень широка, это издательская деятельность, библиотечная работа, обучающие системы, разработка документации, законов, справочных руководств, баз данных, баз знаний и т.д. Наиболее распространенными системами являются HyperCard, HyperStudio, SuperCard, QuickTime фирмы APPLE для персональных компьютеров Macintosh, Linkway - для IBM; из отечественных - Flexis II, автоматизированная система формирования и обработки гипертекста (АСФОГ) и др. В большинстве современных программных продуктов вся помощь (help) составлена с использованием гипертекстовой технологии на базе меню.
Язык гипертекстовой разметки HTML (HyperText Markup Language) был предложен Тимом Бернерсом-Ли в 1989 году в качестве одного из компонентов технологии разработки распределенной гипертекстовой системы World Wide Web.
Идея гипертекстовой информационной системы состоит в том, что пользователь имеет возможность просматривать документы (страницы текста) в том порядке, в котором ему это больше нравится, а не последовательно, как это принято при чтении книг. Поэтому Т. Нельсон и определил гипертекст как нелинейный текст. Достигается это путем создания специального механизма связи различных страниц текста при помощи гипертекстовых ссылок, т.е. у обычного текста есть ссылки типа «следующий-предыдущий», а у гипертекста можно построить еще сколь угодно много других ссылок. Примерами по гипертексту являются энциклопедии, Библия, системы типа «Help».
Простой, на первый взгляд, механизм построения ссылок оказывается довольно сложной задачей, т.к. можно построить статические ссылки, динамические ссылки, ассоциированные с документом в целом или только с отдельными его частями, т.е. контекстные ссылки. Дальнейшее развитие этого подхода приводит к расширению понятия гипертекста за счет других информационных ресурсов, включая графику, аудио- и видеоинформацию, до понятия гипермедиа.
Разработчики HTML должны были решить две задачи:
- дать дизайнерам гипертекстовых баз данных простое средство создания документов;
- сделать это средство достаточно мощным, чтобы отразить имевшиеся на тот момент представления об интерфейсе пользователя гипертекстовых баз данных.
Первая задача была решена за счет выбора таговой модели описания документа. Такая модель широко применяется в системах подготовки документов для печати. Примером такой системы является хорошо известный язык разметки научных документов ТеХ, предложенный Американским Математическим Обществом, и программы его интерпретации.
К моменту создания HTML существовал стандарт языка разметки печатных документов -Standard Generalised Markup Language, который и был взят в качестве основы HTML. Предполагалось, что такое решение поможет использовать существующее программное обеспечение для интерпретации нового языка. Однако будучи доступным широкому кругу пользователей Internet, HTML зажил своей собственной жизнью. Вероятно многие администраторы баз данных WWW и разработчики программного обеспечения для этой системы имеют довольно смутное представление о стандартном языке разметки SGML.
Язык HTML позволяет определять структуру электронного документа с полиграфическим уровнем оформления; результирующий документ может содержать самые разнообразные таги: иллюстрации, аудио- и видео- фрагменты и так далее. Язык включает в свой состав развитые средства для специфицирования нескольких уровней заголовков, шрифтовых выделений, различных групп объектов, например, словари, каталоги или меню для размещения иллюстраций и других фрагментов, а также множество других возможностей.
Вторым важным моментом, повлиявшим на судьбу HTML, стал выбор в качестве основы гипертекстовой базы данных обычного текстового файла, который хранится средствами файловой системы операционной среды компьютера. Такой выбор был сделан под влиянием следующих факторов:
- такой файл можно создать в любом текстовом редакторе на любой аппаратной платформе в среде любой операционной системы;
- к моменту разработки HTML существовал американский стандарт для разработки сетевых информационных систем - Z39.50, в котором в качестве единицы хранения указывался простой текстовый файл в кодировке LATIN 1, что соответствует US ASCII.
Таким образом, гипертекстовая база данных в концепции WWW - это набор текстовых файлов, размеченных на языке HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки).
Такой подход предполагает наличие еще одной компоненты технологии - интерпретатора языка. В World Wide Web функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя.
Сервер, кроме доступа к документам и обработки гипертекстовых ссылок, осуществляет также препроцессорную обработку документов, в то время как интерфейс пользователя осуществляет интерпретацию конструкций языка, связанных с представлением информации.
Кроме этих возможностей, которые фиксируют текущую практику использования HTML, современные программы просмотра HTML-документов позволяют реализовать и ряд других возможностей разметки текста:
- разметка математических формул (HTML 3.0);
- дополнительные контейнеры заголовка (HTML 3.0, Netscape Extensions, Microsoft Extensions);
- дополнительные атрибуты стандартных контейнеров тела документа (ALIGN, BGCOLOR, TARGET и т.п.);
- разбиение страницы на фреймы;
- открытие дополнительных окон и др.
Также, помимо возможностей разметки текста, включения мультимедиа и формирования гипертекстовых связей, в HTML включены дополнительные средства работы с мультимедиа, языки программирования, таблицы стилей, упрощенные средства печати изображений и документов. Эти возможности служат интернационализации WWW и распространению ее по всему миру. Кроме этого, для управления сценариями просмотра страниц Website (гипертекстовой базы данных, выполненной в технологии World Wide Web) можно использовать языки программирования этих сценариев типа JavaScript, Java и VBScript.