После отыскания параметров уравнение множественной регрессии нужно проверить на статистическую значимость и надежность.
Для этого используются: 1) Индекс множественной корреляции
2) Частные коэффициенты корреляции
3) F – критерий Фишера
4) t – статистика
1) Индекс множественной корреляции R
σ2у – общая дисперсия результативного признака;
σ2ост – остаточная дисперсия для уравнения.
Этот индекс показывает, на сколько тесная связь между факторами и результатом.
Если модель построена правильно, то индекс множественной корреляции существенно отличается от максимального индекса парной корреляции.
Rx1x2…xn > max (rxy)
Индекс линейной корреляции может служить индикатором необходимости включения в модель дополнительного признака.
Если при включении дополнительного признака изменяется второй знак, то включение этого признака оправдано.
R2х1,х2,…,хn показывает процент объясненной регрессии с помощью данного уравнения.
2)Частные коэффициенты корреляции – это коэффициенты линейной корреляции, характеризующие тесноту связи между результатом и соответствующим фактором при устранении влияния всех других факторов, входящих в уравнение.
R2 в числителе = R2 всего уравнения
R2 в знаменателе = коэффициент детерминации при исключении фактора Хi
Порядок расчета: 1. Составляется матрица парных коэффициентов корреляции;
2. Находятся частные коэффициенты корреляции первого порядка (частные коэффициенты корреляции между У и двумя другими факторами).
х1 и х2:
х1, х2, х3: ryx1x2 ryx2x3 ryx1x3
Далее проводим анализ, включение какого фактора оказывает сильное влияние на результат.
3) Критерий Фишера
Дфактор – факторная сумма квадратов, деленная на одну степень свободы.
Дост – остаточная сумма квадратов, деленная на одну степень свободы.
k – количество факторов или независимых переменных.
Коэффициент Фишера показывает значимость уравнения регрессии.
Если Fфакт > Fтабл – то уравнение регрессии статистически значимо.
4) t – статистика рассчитывается стандартным образом, и показывает статистическую значимость того или иного параметра.