Если нарушена хотя бы одна из предпосылок, то процедура не является классическим регрессионным анализом.
Предпосылки КРА
Стандартная процедура классического регрессионного анализа
Стандартная процедура классического регрессионного анализа пригодна как для спланированного и не спланированного эксперимента. Она заключается в последовательной реализации следующих шагов:
1. На основе априорной информации выбирают предварительную структуру регрессионной модели.
2. Получают методом наименьших квадратов оценки коэффициентов регрессии.
3. Составляют таблицу дисперсионного анализа результатов оценивания.
4. Проверяется значимость коэффициентов регрессии, не значимые коэффициенты исключаются (надежные результаты появляются только для ортогональных планов).
5. Проверяется адекватность модели. Если модель неадекватна, то она должна быть либо откорректирована, либо заменена.
6. Если предпосылки классического регрессионного анализа нарушены, то необходимо применить методы обработки данных, основанные на специальных алгоритмах.
7. Строятся доверительные интервалы и совместные доверительные области для оценок регрессионных коэффициентов.
1. Модели ограничивают классом линейных вида:
коэффициенты регрессор случайная помеха
Здесь - случайная величина, поэтому тоже случайная величина с тем же распределением.
2. Математическое ожидание , для всех строк матрицы наблюдений.
3. Значения случайной величины не коррелированны и имеют одинаковые дисперсии. Это условие однородности наблюдений.
4. Случайная величина имеет нормальное распределение.
5. Матрица регрессоров не является случайной
Элементы этой матрицы - неслучайные числа точно заданные исследователем.
6. На значение коэффициентов не накладывается никаких ограничений.
7. Ранг матрицы F равен числу коэффициентов модели
Является наиболее сложным для выработки компенсирующих действий.
Весь регрессионный анализ и планирование эксперимента основаны на предположении, что наблюдения распределены в соответствии с нормальным законом ,
Где
Характерной особенностью этого распределения является то, что преобладающая часть наблюдений (99,73%) сосредоточена в определенном интервале . Хвосты нормального распределения короткие. Однако в реальных распределениях грубые ошибки не столь редкие события. Чаще всего реальные измерения распределены по закону «с длинными хвостами».
Модель такого распределения может быть сконструирована из нормального распределения следующим образом:
– степень загрязнения нормальной совокупности грубыми ошибками.
Если <0,05 – то распределение почти нормальное.
Если - распределение «с длинными хвостами»
Обычно в качестве индикаторов, показывающих степень отличия распределения данной случайной величины y от нормального используют коэффициент ассиметрии и эксцесс.
Если – то распределение скошено вправо
Если – то распределение скошено влево
Если – то считается, что в распределении есть «длинные хвосты»
Нарушение нормальности порождает две группы проблем:
1. проблема устойчивости классического анализа к нарушениям нормальности.
2. модификация процедуры классического анализа с учетом отклонения от нормальности и разработка свободных от распределения методов.