Считают, что факторы коллинеарны, если rxixj ≥ 0,7, т.е факторы хi и xj тесно связаны между собой и находятся в линейной зависимости => хi и xj друг друга дублируют и один из них рекомендуется исключить из регрессии.
Оставляют в уравнении фактор, имеющий: 1) тесную связь с результатом;
2) наименьшую тесноту связи с другими факторами.
Для оценки мультиколлинеарности нужно построить матрицу парных линейных коэффициентов корреляции:
MS Excel: Сервис → Анализ данных → Корреляция → Выбор диапазона
В результате выходит таблица
у
х1
х2
х3
у
х1
0,8
х2
0,7
0,8
х3
0,6
0,5
0,2
Rx1x2 = 0,8 > 0,7 => х1 и x2 коллинеарны.
у = f (х2, х3) фактор х3 наиболее независим в данной системе, т.к. его линейные коэффициенты корреляции наименьшие (0,2).
Существуют случаи, когда нужно включить в модель факторы, имеющие сильную связь между собой, тогда используют следующие подходы для преодоления сильной межфакторной корреляции:
1. Исключение факторов;
2. Преобразование факторов, чтобы уменьшить корреляцию между ними:
А) переход к первым разностям
х1; х2; х3
х2 → х2 - х1; х3 → х3 – х2 и т.д.
Каждый уровень ряда заменяем на абсолютный прирост, соответствующий этому уровню. Используется в рядах динамики.
Б) метод главных компонент
Переход от исходных переменных к их линейным комбинациям.
3. Совмещенное уравнение регрессии
Отражает не только зависимость результата от фактора, но и совместное влияние факторов на результат.