Семантическая паутина ( англ.. Semantic web ) - новая концепция развития Всемирной паутины и сети Интернет, которая создана и внедряется Консорциумом Всемирной паутины ( англ. World Wide Web Consortium, W3C ). Другие названия - семантический веб, семантическая сеть. Хотя понятие семантическая сеть, возникшим ранее, породило понятие семантическая паутина, их следует отделять.
Термин впервые ввел августа Тим Бернерс-Ли в мае 2001 года в журнале «Scientific American».
Цель
Семантическая паутина - это надстройка над существующей Всемирной паутиной, которая призвана сделать информацию, размещенную в сети, более понятной для компьютеров. Известно, что почти вся информация в Интернете находится в текстовой форме. Не секрет также, что прогресс в области обработки человеческой речи ( англ.Natural Language Processing, NLP ) идет очень медленно. Компьютеры не могут воспринять и осмыслить словесную информацию, размещенную в Интернете, и в ближайшее время, вероятно, не смогут. Тогда возникает вопрос - как же заставить компьютеры понимать смысл размещенной в сети информации и научить компьютеры пользоваться ею?На этот вопрос и призвана ответить концепция семантической паутины. Слово «семантическая» в данном случае означает «осмысленная», «поняла».
Основная идея
В настоящее время компьютеры принимают довольно ограниченное участие в формировании и обработке информации в сети Интернет. Трудно представить, но это так.Функции компьютеров в основном сводятся к сохранению, отображения и поиска информации. В то же время создание информации, ее оценка, классификация и актуализация - все это по-прежнему выполняет человек. Как включить компьютер в эти процессы? Если компьютер пока нельзя научить понимать человеческий язык, то нужно использовать язык, который был бы понятным компьютеру. То есть, в идеальном варианте, вся информация в Интернете должна размещаться на двух языках: на человеческом языке для человека и компьютерным языком для понимания компьютера. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы дополнен описанием, понятным компьютеру.
-
The Semantic Web will enable machines to COMPREHEND semantic documents and data, not human speech and writings.
Семантическая паутина позволит машинам ПОНИМАТЬ семантику документов и данных, но не человеческих речей и письменных сообщений. - Тим Бернерс-Ли.
|
Реализация
Стек понятий семантической паутины
Для создания понятного компьютеру описания ресурса в семантической паутине используется формат RDF ( англ.Resource Description Framework ), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. RDF был утвержден как стандарт W3C в феврале 2004 года. RDF - это система описания сетевых ресурсов, понятна компьютеру. Формат RDF предназначен для хранения метаданных (метаданные - это данные о данных).Согласно концепции семантической паутины, описание в формате RDF должен прикрепляться к каждому сетевому ресурсу. Документы RDF должны обрабатываться компьютером автоматически, RDF не предназначен для чтения и использования человеком. На сегодня формат RDF уже сформировался и получил широкое распространение, он служит каркасом для создания семантической паутины.
RDFS ( англ. RDF Schema ) - это важная надстройка над RDF, позволяющая создавать классы и свойства (как вобъектно-ориентированном программировании ).
Следующим важным направлением концепции семантической паутины является язык OWL ( англ. Web Ontology Language, произносится ['Оул]), что стала Рекомендацией W3C в феврале 2004 года. Этот язык построена на форматах RDF и RDFS, она предназначена для обработки информации в сети. Язык OWL имеет 3 степени детализации, что является новым словом в компьютерных технологиях. Она также легко масштабируется и согласуется с самыми современными сетевыми стандартами. В 2008 году был принят новый стандарт OWL 2. Теоретической основой OWL являетсяОписательная логика.
SPARQL ( англ. Protocol And RDF Query Language, произносится [спьаркл]) - новый язык запросов для быстрого доступа к данным RDF. Используя обычный протокол и язык SPARQL, программы могут анализировать RDF-описания ресурсов и получать из сети необходимую информацию.
RIF - формат обмена правилами ( англ. Rule Interchange Format ).