Линейная дискриминантная функция D трех переменных X, Y и Z имеет вид:
D= а1Х + а2У + а3Z
Коэффициенты аj дискриминантной функции можно найти из системы трех уравнений:
(1)
В формулах системы (1) covij - элементы ковариационной матрицы [COV]объединенной выборки [А+В]признаков X, Y и Z, которая имеет вид:
ХА+В УА+В ZА+В ХА+В YА+В ZА+В
a dj - разности средних значений признаков Xt Y и Z по выборкам А и В:
Значения элементов covij главной диагонали ковариационной матрицы [COV] представляют собой дисперсии переменных X, Y и Z объединенной выборки [A+В], а значения недиагональных элементов - ковариации cov (X, Y) = cov (Y, X), cov (X, Z) = cov(Z, X) и cov (Y, Z) = cov (Z, Y). Эти элементы рассчитываются по формулам:
Система уравнений (1) решается с помощью детерминантов матрицы [COV]по формулам Крамера: , , , а детерминант ∆ матрицы [COV] объединенной выборки [A+В] – по формуле:
Детерминанты рассчитываются по тому же правилу, что и детерминант ∆. Матрицы для их вычислении образуются из основной матрицы [COV] путем замены в ней столбца, соответствующего индексу j коэффициента aj, вектором-столбцом [d]. Эти матрицы и расчетные формулы имеют вид:
После нахождения коэффициентов ajстроится уравнение дискриминантной функции и вычисляется значение дискриминантного индекса do, служащего для определения принадлежности любого трехмерного наблюдения из третьей выборки С к одной из двух исходных выборок (А или В):
Принадлежность любого классифицируемого трехмерного наблюдения к одной из двух анализируемых выборок (А или В) можно определить путем подстановки его значений X, Y и Z в неравенство а1∙X + а2∙Y+ а3∙Z ³ do. Если неравенство выполняется, то единичное наблюдение следует отнести к первой совокупности, т.е. к выборке А, иначе - к выборке В.
Статистическая значимость рассчитанного уравнения линейной дискриминантной функции оценивается с помощью критерия Махалонобиса
dМ2= а1∙ d1 + а2∙ d2+ а3∙ d3
и F— критерия Фишера
где m - количество переменных.
Если Fpaсч.>Fmeop. для принятого уровня значимости а и при степенях свободы f1 = т-2, f2= nа+ nB -т-1,то нулевая гипотеза о равенстве двух трехмерных средних (т.е. о равенстве нулю расстояния dМ2 между ними) отвергается и дискриминантная функция признается статистически значимой.
Относительный вклад j-й переменной в расстояние dМ2 между трехмерными средними двух выборок А и В определяется по формуле: .
Величину ejможно использовать для минимизации количества признаков в классификации. Для этого признаки ранжируют по степени их влияния на дискриминантную функцию D в соответствии с их вкладами ej. При этом признаки с отрицательными значениями ej из дальнейших расчетов исключаются как неинформативные.