КОЛИЧЕСТВО ЧЛЕНОВ И СООТНОШЕНИЕ МЕЖДУ НИМИ, ОПРЕДЕЛЯЮЩИЕ СТРУКТУРУ МОДЕЛИ
ИНТЕРВАЛЬНАЯ ОЦЕНКА МОДЕЛИ РЕГРЕССИИ
* Доверительный интервал для функции регрессии .
Для условного материального ожидания с заданной надежностью доверительной вероятностью j = 1- неизвестное значение.
Найдем дисперсию групповой средней:
Уравнение регрессии через среднюю:
Построим эту модель геометрически:
а – коэффициенты называются параметрами модели
Доверительный интервал – интервал, который попадет в значение параметра модели с заданной вероятностью (н.р. 0,95).
(1)
Основываясь на гипотезы регрессионного анализа можно оценить, что:
(2)
t – распределение Стьюдента.
k = n – 2 (число степеней свободы) позволяет построить доверительный интервал для условного математического ожидания.
(3)
- общая оценка дисперсии.
Для оценки индивидуальных значений необходимо учитывать рассеяние вокруг линий регрессии.
(4)
(5)
Можно показать, что при выполнении (5) предпосылки регрессионного анализа равны:
Если распределение заменить его оценкой , то статистика t определяется с помощью
(6)
Тогда интервальная оценка будет иметь следующий вид:
(7)
Проверить значимость уравнения регрессии – установить соответствует ли математическая модель, выражающая зависимость между переменными экспериментальным данным, и достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной.
Проверка значимости осуществляется на основании дисперсионного анализа (целое направление математической статистики).
Основные идем дисперсионного анализа определяют у нас ошибку модели, а именно:
Q – общая сумма квадратов отклонений зависимой переменной;
Qr – сумма квадратов отклонений обусловленная регрессией;
Qe – остаточная сумма квадратов отклонений, характеризующая влияние неучтенных факторов и ошибок.
- несмещенная оценка дисперсии, характеризующая неучтенные факторы и ошибки
Общая
n-1
-
m – число оцениваемых параметров
n – число наблюдений
Замечания:
1. При оценке общей суммы квадратов полезно иметь формулу:
2. При отсутствии линейной зависимости случайные величины ; подчиняются и квадрату распределения, соответственно, с m-1, n-m степенями свободы, а их отношение – F-распределению.
Уравнение регрессии значимо на уровне , если фактически наблюдаемое значение статистики
(5)
k1 = m-1
k2 = n-m
где есть распределение Фишера – Сне – Декора, заданное степенями свободы.
С учетом определений средних квадратов можно сказать, что значение F показывает в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с ее средней.
В случае парной регрессии значение (5) имеет следующий вид:
(5’)
3. Значимость уравнения линейной парной регрессии может проведена и другим способом, если оценить значение коэффициента Б с помощью Т-распределения Стьюдента.
Уравнение парной регрессии или коэффициент регрессии Б, значимый на уровне (иначе гипотеза отвергается), если фактически наблюдаемое значение статистики:
(6)
Для парной линейной регрессии уравнения 5’ и 6 равносильны с учетом .
В нескольких задачах требуется оценить значимость коэффициента корреляции, при этом исходят из того, что при отсутствии корреляционной связи статистика t:
- t- распределение Стьюдента с (n-2) степенями свободы
(7),
где - табличные значения критерия Стьюдента (5’) (6)