Под семантикой понимается смысловое содержание информации. Место семантики в системе понятий семиотики (наука о знаках, словах и языках) см. рис *.
Рис *. Место семантики в системе понятий семиотики
Обозначения:
Z – знак;
Z’ – соотносящийся знак;
С – смысл;
О – объект;
Ч – человек.
Знаком – называется условное изображение элементов сообщения; словом – совокупность знаков, имеющих смысловое (предметное) значение; языком – словарь и правила пользования им.
Соответственно приведенной выше структуре в семиотике различаются синтактический, семантический, сигматический и прагматический аспекты теории информации.
Структурные и статистические оценки информации относятся к синтактическому аспекту.
Количественная мера семантической информации по Карнену и Бар-Хиллелу.
Карненом было предложено использовать для цели измерения смысла информации функции истинности и ложности логических высказываний или предложений. В основу дискретного описания объекта положено неделимое (подобно атомарному) предложение, аналогичное элементарному событию теории вероятностей и соответствующее неделимому кванту сообщения.
Эта оценка получила название содержательности информации, а информация с семантической точки зрения имеет вид некоторого знания, представленного высказыванием (суждением, предложением) или текстом.
Под высказыванием понимается повествовательное предложение, утверждающее тот или иной факт. Побудительные и вопросительные предложения не могут быть высказываниями.
Содержательность высказывания определяется как множество выводимых из этого высказывания следствий определенного типа. Предполагается сравнительно простой язык, содержащий в качестве исходных символов конечное число имен индивидов элементарных предикатов и логические связки логики высказываний. Карненом были предложены два варианта оценки величины информации содержания.
Согласно первому варианту: величина информации высказывания равна вероятности (степени правдоподобия) отрицания этого высказывания А. Мера содержательности обозначается cont (content – содержание), а содержательность события А выражается через функцию m(A) (содержательность его отрицания) в виде:
.
Во втором варианте величина информации высказывания:
.
Оценка содержательности информации основана на математической логике, в которой функции истинности m(A) и ложности , имеют по внешним признакам формальное сходство с функциями вероятностей события Р(А) и антисобытия Q(A) в классической теории вероятности.
Для обоих направления выполняются сходные естественные условия:
и как для вероятности имеем
Следовательно, формально сходны выражения для оценки статистических и логических количеств информации. В этом случае выражение ** для логической оценки количества информации, получившее обозначение , имеет сходное выражение:
.
Таким образом, отличие статистической оценки от логической состоит в том, что в первом случае учитывается только вероятность реализации тех или иных событий, а во втором случае – мера истинности или ложности событий, что и позволяется ближе подойти к оценке смысла информации.
До сих пор при оценки семантической меры информации (полезности) не рассматривалась возможность ее восприятия и обработки приемником. Можно рассматривать полезность информации в зависимости как от степени новизны, так и от способности приемника к ее восприятию и обработке.
Следствием потребительского аспекта является дополнение информации понятием актуации в смысле активного запроса информации со стороны заинтересованного приемника. При этом имеется в виду тесная связь между этими понятиями, так как в каждой ситуации (запросе) может содержаться некоторая информация.
Рис **. Обобщенное представление процесса обмена информацией между двумя системами
Существуют три типа вопросов:
– в одном отсутствует предвосхищение опыта;
– в другом имеется некоторая доля ответа;
– в третьем полностью содержится ответ и требуется только его подтверждение.
Таким образом, замыкается связь между двумя системами (рис **): системой Sx, являющейся поставщиком информации, и системой Sy – потребителем информации.
Процесс смыслового анализа некоторой ситуации можно интерпретировать как изменение тезауруса под влиянием данного текста, то есть тезаурус является характеристикой приемника информации.
С учетом этого систему извлечения, передачи и приема информации можно представить в виде рис ***.
Рис ***. Схема извлечения, передачи и приема информации с учетом H, N, θ.
На этой схеме источник (объект управления) обладает определенной энтропией Н, которая характеризует способность источника отдавать информацию. Отдача может быть неполной. Информация I=H1-H2 поступает в канал, где часть информации теряется или искажается шумом N. Оставшаяся информация I достигает приемника и воспринимается им в той степени, в какой это позволяет тезаурус.
Может оказаться, что несмотря на высокое богатство структур и статистики информации на передающей стороне, приемная сторона не будет нуждаться в этой информации, так как она уже ею обладает, не имеет в ней потребности или не умеет с ней обращаться.
Рис ****. Изменение тезауруса
Существует и другое положение: если тезаурус неадекватен передаваемой информации, очень мал или вообще отсутствует, то самая новая и богатая информация не воспринимается вследствие того, что она не будет понята приемником.
С приемом новой информации тезаурус может обогащаться.
Тезаурус введен в XIII в. флорентийцем Лотики для названия энциклопедии (лат. сокровище, запас, богатство).
Пусть богатство (объем) тезауруса количественно оценивается некоторой величиной θ. Изменение тезауруса θ под действием сообщения Н можно оценить количеством информации I(H, θ), которая показано на рис ****.
Имеется некоторое минимальное количество Imin(θ) априорной информации I(θ) тезауруса θ в системе Sy, при котором система Sy начинает понимать сообщения, поступающие от системы Sx. После этого воспринимаемая информация I(H, θ) возрастает при увеличении I(θ) до точки с координатами (Imax(H, θ) и Iopt(θ)), где достигается максимум восприятия. Далее следует спад, обусловленный тем, что априорные знания (тезаурус приемника) становятся настолько богатыми, что источник не приносит новой полезной информации. В точке Imax(θ) восприятие информации прекращается, так как система Sy оказывается насыщенной знаниями в пределах возможностей системы Sx – потенциального источника информации.
Если языки X и Y однозначно определены, то могут быть предусмотрены трансляторы (переводчики) Y→X и X→Y, располагаемые в Sx и Sy или в системах Sx и Sy совместно. В других случаях возникает проблема взаимоотношений, которая решается методами распознавания образов и самообучением. В приведенной выше схеме указаны синтактические, статистические и семантические характеристики информации.
Композиция отражает те же стороны информационной системы, что структура информации (синтактика); тезаурус – те же, что и энтропия; прагматика – те же, что и семантика. Наиболее близкими между собой являются понятия структуры и композиции.
Естественной функцией приемной стороны является композиция, заключающаяся в том, что по возможности восстанавливаются нарушенные связи между элементами информации или воссоздается непрерывность информационного комплекса или информационного процесса.