Регрессия главных компонент

Для построения модели с помощью регрессии главных компонент необходимо вычислить главные компоненты ковариационной матрицы независимых переменных. Результаты вычисления представлены в табл. 5. В последней строке таблицы указана дисперсия соответствующая главным факторам.

Таблица 5 — Главные компоненты

Исходные факторы	1-я главная компонента	2-ая главная компонента	3-ая главная компонента	4-ая главная компонента
РТС	0,999587	-0,02791	0,006888	0,000536
US	-0,00493	-0,03338	0,513564	0,857387
EURO	-0,00451	0,040409	0,857848	-0,51229
OIL	0,027965	0,998235	-0,01736	0,049422
Дисперсия факторов	360225,4	315,5911	11,91183	0,401183

На рис. 4 представлено графическое отображение главных компонент независимых переменных.

Рисунок 4 — Главные компоненты

Модель, поостренная с помощью регрессии главных компонент, имеет вид

(3)

где — главные факторы. Главные факторы представляют комбинацию исходных факторов

(4)

Отличие главных факторов от исходных факторов заключается в том, что главнее факторы являются статистически независимыми, т.е. корреляция между ними равна нулю.

В табл. 6 показаны коэффициенты линейной регрессионной 4-х факторной модели. Если в формулу (3) подставить выражения (4), то получаем формулу, описывающую регрессионную модель в форме (1). Коэффициенты регрессионной модели в форме (1) полностью совпадают с коэффициентами классической регрессионной модели (см. табл. 1)

Таблица 6 — Характеристики регрессионной 4-х факторной модели (главные факторы)

Главные факторы	Коэффициенты регрессии	Коэффициент значимости
	4.424777	394.542
1-ый фактор	0.001637	88.505
2-ый фактор	-0.002802	-4.486
3-ый фактор	0.069879	21.53
4-ый фактор	0.159117	9.077

Как видно из таблицы 6 коэффициенты первой и третьей модели являются существенно значимыми. Коэффициент, соответствующий, не является статистически значимым. Поэтому с целью улучшения качества модели построим модель на 1 и 3 главном факторе. В табл. 7 представлены коэффициенты 2-х факторной регрессионной модели. Отметим, что все коэффициенты регрессионной модели являются существенно значимыми.

Таблица 7— Характеристики регрессионной 2-х факторной модели (главные факторы)

Главные факторы	Коэффициенты регрессии	Коэффициент значимости
	4,429598	369,591
1-ый фактор	0,001636	82,733
3-ый фактор	0,070071	20,184

При переходе от главных факторов к исходным факторам регрессионная модель описывается формулой (1). Коэффициенты регрессионной модели и характеристики их значимости представлены в табл. 8.

Таблица 8 — Линейная 4-х факторная регрессионная модель (исходные факторы)

Исходные факторы	Коэффициенты регрессии	Коэффициент значимости
	-2,0873	-174,155
РТС	0,0021	68,3891
EURO	0,0601	20,1818
US	0,036	20,1797
OIL	-0,0012	-19,4236

В таблице 9 представлены ошибки прогнозирования, полученные на тестовой выборке, для 2-х факторной моделяи. Как видно из таблицы ошибки прогнозирования не отличаются и это говорит, что качество моделей одного уровня

Таблица 9 — Ошибки прогнозирования моделей

Число главных факторов	MAD	MSE	SSE	MAPE %	MPE %	MSEN %
1-4	0.338	0.159	0.043	8.275	-7.347	9.573
1,3	0.344	0.139	0.041	8.294	-8.294	8.359

На рис. 5 показано изменение курса доллара на тестовой выборке (пунктирная линия) и изменение курса доллара, вычисленные с помощью 3-х факторной модели

Рисунок 5 — Изменение цены на ценные бумаги на тестовой выборке (2-х факторная модель)

Выводы

В результате выполненных исследований получены следующие результаты:

1. Вычислены главные компоненты независимых переменных.

2.Построена классическая регрессионная модель:, которая показала хорошее качество на тестовой выборке.

3. Исходя из классической регрессионной модели, можно увидеть, что при увеличении индекса РТС, цены на нефть, курса доллара цена на ценные бумаги растет,а при увеличении курса евро уменьшается.

3. Построены две модели на основе регрессии главных компонент и сравнили их с классической регрессионной моделью. Показано, что использование главных компонент позволяет построить 2-х факторную модель, которая демонстрирует более высокую точность нежели классическая регрессионная модель.

4. 2х факторная модель имеет более высокие коэффициенты значимости и наименьшие ошибки прогнозирования.