Вопрос 4.5. Оценка прагматической информации

Вопрос 4.4. Оценка семантической информации

Ю.А. Шрейдер предложил измерять количество семантической информации, содержащейся в сообщении, степенью изменения тезауруса Q под воздействием сообщения. Тезаурус – это совокупность сведений, которыми располагает пользователь или система. Часть информации может утеряться в силу того, что у получателя в тезаурусе нет понятий, являющихся значениями полученных знаков. С другой стороны, если всё сообщение уже включено в тезаурус получателя, то он опятьне получит информации. Наибольшее количество информации получается тогда, когда имеется достаточно много общего в тезаурусе и сообщении для понимания последнего, а также содержатся новые сведения (см. рис. 3.4).

Рис. 3.4. График изменения количества семантической информации

I – количество семантической информации;

S – сообщение;

Q – тезаурус получателя;

Y=- пересечение сообщения и тезауруса получателя.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sр, когда поступающая информация понятна пользователю и несёт ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной.

Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

Заметим, что предварительное расширение тезауруса может как уменьшить, так и увеличить количество информации, содержащейся в сообщении (в отличие от синтаксической информации, которая всегда уменьшает неопределенность). Так, процесс обучения расширяет тезаурус и дает возможность извлекать больше информации из последующих «порций» новых сообщений. Здесь справедлив принцип «чем больше я знаю, тем больше я буду знать». В сущности, это качественный подход к оценке информации.

Ценность (полезность) информации разумно оценивать по тому эффекту, который она оказывает на результат системы. Известны несколько способов определения ценности информации. Все они основаны на представлении о цели, достижению которой способствует информация. Чем в большей мере информация помогает достижению цели, тем более ценной она считается.

1. Если цель наверняка достижима, и притом, несколькими путями, то возможно определение ценности информации по уменьшению материальных или временных затрат благодаря использованию информации. Например, сочетание хороших предметного и алфавитного каталогов библиотеки сокращают время на составление списка литературы по интересующему нас вопросу. Этот метод предложен, в частности Стратоновичем Р.Л.

2. Если достижение цели не обязательно, но вероятно, то возможно использование критерия ценности информации Iц, предложенного А.А. Харкевичем и М.М. Бонгардом, который определяется как изменение вероятности достижения цели, реализации какой-либо задачи при получении дополнительной информации:

Здесь р0 - начальная (до получения данной информации) вероятность достижения цели, р1 - вероятность достижения цели после получения данной информации. Физический смысл логарифмической единицы ценности информации состоит в том, что информация ценностью в р единиц позволяет повысить качество решения задачи в log p раз. При этом существуют, как минимум, три возможности.

А) Если полученная информация не изменяет вероятности достижения цели:

р_{1 =}р_0,, то .

Это означает, что ценность полученной информации равна нулю. Такая информация называется информационным шумом.

Б) Если полученная информация может изменять ситуацию в худшую сторону, т. е. уменьшать вероятность достижения цели, то < 0. Такая информация называется дезинформацией, которая измеряется отрицательным значением количества информации (пример: указатель дорог, развернутый в другую сторону).

В) Если полученная информация может изменять положение дела в лучшую сторону, т.е. увеличить вероятность достижения цели, то > 0. Такая информация называется полезной (ценной) информацией.

3. Предлагаются и детерминированные методы, в частности, такие, в соответствии с которыми ценность информации от проведения исследований определяется как разность между оценкой затрат, связанных с ошибкой в результате отсутствия исследования (дополнительной информации), и затратами, связанными с ошибкой при использовании исследований. Данный метод исходит из допущения, что ЛПР (лица, принимающие решения) могут дать достаточно точную оценку затрат, связанных с неверным решением.

4. Оценкой полезности информации может служить ожидаемый дополнительный доход, который может быть достигнут при использовании сведений в процессе принятия решений. Ценность информации может быть определена как разность между результатами решений, принятых с использованием данной информации и без нее.