Одним из исчислений неопределенности, имеющие сравнительно прочные теоретические основы является теорема Байеса. Теорема Байеса помогает связать информацию, поступающую из различных источников. Она позволяет вычислить относительное правдоподобие конкурирующих гипотез исходя из силы свидетельств.
ОП (Н:Е) = Р (Е : Н) / Р (Е : Н'),
где ОП – отношение правдоподобия
Е – свидетельство
Н – гипотеза
Р (Е : Н) – вероятность свидетельства Е (или события Е), при условии заданной гипотезы Н.
Р (Е : Н') – вероятность этого же свидетельства, при условии ложности данной гипотезы.
Например, если мы знаем вероятность появления сыпи у больных ветряной оспы и вероятность появления другими заболеваниями, то мы можем вычислить заболевания ветряной оспы, если появилась сыпь.
Отношение правдоподобия может быть использовано для уточнения шансов в пользу рассматриваемой гипотезы, если становится известно, что произошло событие Е.
О = Р / (1 - Р)
Р = О / (1+0),
где О – шансы в пользу чего-либо
Р - вероятность
Преобразование оценки «шансы против А» в оценку «шансы за А» производится по следующей формуле
О = 1 / А
Например, 7 против 4 может быть выражено как 1,75 против 1, что соответствует 0,5714 к 1 «за» (или 4 к 7 в пользу рассматриваемой гипотезы).
Байесовская схема уточнения может быть сведена к следующему выражению:
О' (Н) = О (Н)*(Н:Е),
где О(Н) – априорные шансы в пользу гипотезы Н
О' (Н) – результирующие апостериорные шансы, при условии наступления события Е в соответствии с отношением правдоподобия.
С помощью указанной формулы позволяет информацию, полученную из различных источников комбинировать, а по вычисленным апостериорным шансам можно вычислить и вероятности.
Отношение правдоподобия можно получить из простой двумерной таблицы показывающей, на сколько часто случается каждое событие при каждой из гипотез.
Таблица 1.1
Отношение к курению
Продолжительность жизни
Всего
> 75 лет
75 лет или меньше
Курящие (чел)
Некурящие (чел)
ВСЕГО
В приведенной таблице содержатся данные по 100 умершим людям, из которых 44 прожили 75 и больше, и 56 человек не дожили до 75 лет. Причем указано кто из них был курильщиком, а кто нет.
Априорные шансы в этой выборки из 100 случаев в пользу того, что человек проживет более 75 лет, высчитывается по следующей формуле:
О (Долгожитель) = 44 / 56 = 11 / 14 = 0,7857
Отношение правдоподобия считается по следующей формуле:
Учитывая, что априорные шансы в пользу продолжительной жизни равны 11/14 мы можем вычислить апостериорные шансы, что курящий мужчина проживет больше 75 лет пользуясь следующим выражением:
О'(Долгожитель) =ОП(Долгожитель:Курильщик)*
*ОП(Долгожитель:Мужчина)*(Долгожитель)
О'(Долгожитель) = 0,8815*0,8484*11/14 = 0,5867
Вероятность вычисляется:
Р = О/(1+0) = 0,5867/(1,5867) = 0,3701
Начальная вероятность была равна 0,44.
Этот же принцип допускает расчета для большего количества гипотез. ОП всегда положительны, хотя 0 и ∞ могут получаться. Когда ОП > 1, то это указывает на свидетельство в пользу гипотезы. Множитель ОП показывает насколько более вероятна становится данная гипотеза при наличии свидетельств, чем при их отсутствии. Если свидетельства вызывают сомнения, то в некоторых случаях применяют масштабируемое ОП. Масштабируемое ОП считается по следующей формуле:
ОП' = ОП +ВС + (1 - ВС),
где ВС - вероятность того, что свидетельство надежно.
Например, если свидетельство известно с вероятностью Р=0,8, то ОП=1,2 в пользу гипотезы уменьшается до ОП' = 1,2 + 0,8 + (1 - 0,8) = 1,2*0,8 + 0,2=
= 0,96 + 0,2 = 1,16.
Например, ОП=0,5 (значительно противоречащее гипотезе ) увеличится при использовании этой формулы: ОП' = 0,5*0,5 + 0,5 = 0,75.
Отношения правдоподобия имеют два преимущества:
1) Допускают комбинирования нескольких источников данных
2) Их легко корректировать, если свидетельство не надежно само по себе.