Линейная дискриминантная функция D двух переменных Х и У имеет вид D = а1 • X + а2•Y, где а1и а 2 — коэффициенты дискриминантной фунции. Эти коэффициенты находят путем решения системы (1) двух уравнений:
(1)
где d1и d2 - разности средних значений признаков X и У по выборкам А и В, т.е. covjj - элементы ковариационной матрицы [СОV] объединенной выборки [А +В]признаков X и Y. Матрица имеет вид:
(2)
Элементы covjjковариационной матрицы [СОV] представляют собой смешанные моменты первого порядка объединенной выборки [А+В]. Они рассчитываются как среднее произведение отклонений двух величин Х и Y от их средних значений по формуле:
(3)
где SP (X, Y) - сумма произведений отклонений величин X и Y от их средних значений, пАи пВ, объемы выборок А и В. При этом элементы ковариационной матрицы covxy и covyх числекн. равны друг другу, т.е. covxy = covyх, а элементы главной диагонали матрицы covxх и covyу представляют собой дисперсии переменных X и У, которые рассчитьваются по формулам: (4)
(5)
Система уравнений (1) решается с помощью операций обращения и умножения матриц. Однако эта процедура является довольно сложной. Поэтому для определения коэффициентов мы будем использовать более простой способ вычислений с помощью определителей (детерминантов) ковариационной матрицы по формулам Крамера:
и
где D - определитель ковариационной матрицы [COV]объединенной выборки [А+В], , - определители матриц, получаемых из основной матрицы [COV] путем замены в ней столбца, соответствующего индексу коэффициента aj , вектором-столбцом [dj]. При этом для нахождения детерминанта в основной матрице заменяется первый столбец covij , а для детерминанта - второй столбец covij.
Детерминанты D, и вычисляются по следующим формулам:
После вычисления коэффициентов a1и a2строится уравнение дискриминантаой функции и рассчитывается значение дискриминантного индекса do
Дискриминантный индекс do -соответствует точке разделяющей прямой на рис.1 которая лежит точно посредине между центрами выборки А и выборки В. Поэтому с его помощью можно сделать вывод о принадлежности любого двухмерного наблюдения из третьей выборки С кодной из двух исходных групп (выборке А или выборке В). Для этого значения X и Y двухмерного наблюдения из выборки С подставляются в неравенство а1∙X + а2∙Y³ do . Если неравенство выполняется, то это наблюдение следует отнести к выборке А, иначе - к выборке В.
Статистическую значимость рассчитанного уравнения линейной дискриминантной функции можно оценить с помощью F-критерия Фишера и критерия Махалонобиса d, который характеризует так называемое "обобщенное расстояние"между двумя многомерными средними выраженное в единицах дисперсии объединенной выборки [А+В]. Графически критерий Махалонобисасоответствует расстоянию на рис. 1 между центрами двухмерных распределений, т.е. расстоянию между центром , и центром , Чем больше это расстояние d2, тем более уверенное разделение многомерных наблюдений на две группы можно провести.
Для случая двух переменных критерий Махалонобисарассчитывается по формуле
dМ2= а1∙ d1 + а2∙ d2
Критерий Фишерачерез эторасстояние определяется по формуле:
где т - количество переменных.
(пА+пB-2)-т
Если Fрасч³Fтеор. для принятогоуровня значимости а и при степенях свободы f1 = т-2, f2= nа+ nB -т-1, то нулевая гипотеза о равенстве двух многомерных средних (т.е. о равенстве нулю расстояния d2 между ними) отвергается, т.е. дискриминантная функция признается статистически значимой.
Относительный вклад j-й переменной в расстояние d2 между многомерными средними двух групп А и В определяется по формуле Однако следует учесть, что эта мера отражает прямой вклад только каждой j-й переменной, но не учитывает взаимодействие между переменными. Если две и более переменные, входящие в дискриминантную функцию не являются независимыми, то их совместный вклад в расстояние d2може быть более значительным, чем это следует из величин ej.
Следует учесть также, что если классифицируемый объект из выборки С не принадлежит к одной из двух обучающих выборок А или В, то применение линейного дискриминантного анализа может привести к неправильным представлениям и выводам.