ЭС и теория вероятностей.

Условная вероятность.

Условная вероятность события d при данном событииs – это вероятность наступления d при условии, что наступило s.

В традиционной теории вероятностей для вычисления условной вероятности используется формула:

P(d|s) = P(dÙs) / P(s) (1)

или

P(s|d) = P(dÙs) / P(d)

или

P(dÙs) = P(s|d)P(d)

Поделим обе части последней формулы на P(s)и воспользуемся первой формулой:

P(d|s) = P(s|d)P(d) / P(s). (2)

Эта формула часто называется инверсной формулой условной вероятности, она представляет правило Байеса в простейшем виде. Суть формулы в том, что условная вероятность P(d|s)может быть вычислена через «инверсную» условную вероятность P(s|d), которую мы считаем известной. Иногда P(d)называют априорной вероятностью события d, а P(d|s)–апостериорной вероятностью.

В ЭС формула (2) удобнее формулы (1). Покажем это на примере. Пусть у пациента наблюдается боль в груди и необходимо оценить вероятность у него инфаркта миокарда (учитывая, что боль в груди может быть следствием совсем другого заболевания). Итак d – и.м., s – б.г. Для вычисления искомой вероятности по формуле (1) нужно знать, сколько человек в мире страдают б.г. и сколько из них страдают б.г. потому, что больны и.м. Обычно такая информация отсутствует, особенно та, которая необходима для вычисления P(dÙs).

Эта трудность послужила основанием для негативной оценки роли ТВ в ИИ. Однако, существует и так называемая «субъективистская» точка зрения на ТВ, которая позволяет иметь дело с оценками вероятностей наступления событий, а не с их частотой. Например, врач-эксперт может оценить, у какой части инфарктников наблюдается боль в груди и на этом основании дать оценку условной вероятности Р(и.м.|б.г.). А оценку вероятности заболевания и.м. можно взять из публикуемой статистики.

Если имеется некое множество nсимптомов S и множество m возможных заболеваний D, то для вероятности каждого заболевания d нужно использовать правило Байеса в более общей форме:

P(d|s₁Ù…Ùs_k) = P(s₁Ù…Ùs_k|d)P(d) / P(s₁Ù…Ùs_k).

Вычисление этой вероятности достаточно трудоемко, так как для вычисления P(s₁Ù…Ùs_k)нужно предварительно вычислить произведение P(s₁| s₂…Ùs_k)P(s₂|s₃…Ùs_k) … P(s_k).Однако если предположить, что некоторые симптомы независимы друг от друга, то объем вычислений снижается. Действительно, если s_iиs_j независимы, то P(s_i) = P(s_i|s_j), а отсюда следует, что P(s_iÙs_j) = P(s_i)P(s_j).Если все симптомы независимы, то объем вычислений не будет существенно отличаться от случая учета одного симптома.

Наконец, если независимость симптомов теоретически не подтверждается, эксперт может воспользоваться условной независимостью, опираясь на свой профессиональный опыт. Например, если в автомобиле не работает освещение и нет горючего, то эксперт может смело сказать, что эти симптомы независимы. Но если не работает освещение и машина не заводится, то эти симптомы нельзя считать независимыми, так как они могут быть вызваны разрядкой аккумулятора.

Таким образом, использование ТВ ставит перед разработчиками ЭС следующие проблемы:

– можно предположить, что все данные (симптомы) независимы и использовать менее трудоемкие методы вычислений, но при этом достоверность результатов будет снижаться;

– для получения более достоверных результатов нужно отслеживать зависимости данных друг от друга и оперативно обновлять соответствующую информацию, т.е. использовать значительно более трудоемкие методы.

Коэффициенты уверенности.

Альтернативным подходом к оценке достоверности тех или иных заключений основан на так называемых правилах влияния, которые в общем случае можно представить так:

ЕСЛИ	пациент имеет показания и симптомы s₁Ù…Ùs_k и имеют место некоторые фоновые условия t₁Ù…Ùt_m,
ТО	Можно с уверенностью tзаключить, что пациент страдает заболеваниемd.

Коэффициент уверенности tпринимает значения в диапазоне [-1, 1]. Если t = +1, это означает, что при соблюдении всех указанных в правиле условий эксперт абсолютно уверен в правильности заключения d. Если t = -1, это означает, что эксперт абсолютно уверен в ошибочности заключения. Значения t > 0 указывают на степень уверенности эксперта в правильности заключения, а значения t< 0 – степень уверенности в ошибочности заключения.

Формулы указанного вида применяются для того, чтобы заменить громоздкие вычисления условных вероятностей P(d|s₁Ù…Ùs_k)легко вычисляемой приближенной оценкой и тем самым приблизить процесс принятия решений ЭС к способу принятия решений экспертом. Пусть CF(d,s₁Ù…Ùs_kÙ t₁Ù…Ùt_m) – коэффициент уверенности в достоверности заключения d,зависящий от коэффициентов уверенности в достоверности симптомов s₁,…,s_k и значений фоновых условий t₁,…,t_m; CF(s_i)и SF(t_j) – коэффициенты уверенности в достоверности соответствующих симптомов и фоновых условий. Тогда вычисление коэффициента уверенности в достоверности заключения вычисляется по следующей формуле:

CF(d,s₁Ù…Ùs_kÙ t₁Ù…Ùt_m) = t ´ min(CF(s₁), …, CF(s_k), SF(t₁), … , SF(t_m)).