Для построения модели с помощью регрессии главных компонент необходимо вычислить главные компоненты ковариационной матрицы независимых переменных. Результаты вычисления представлены в табл. 5. В последней строке таблицы указана дисперсия соответствующая главным факторам.
Таблица 5 — Главные компоненты
Исходные факторы
1-я главная компонента
2-ая главная компонента
3-ая главная компонента
4-ая главная компонента
РТС
0,999587
-0,02791
0,006888
0,000536
US
-0,00493
-0,03338
0,513564
0,857387
EURO
-0,00451
0,040409
0,857848
-0,51229
OIL
0,027965
0,998235
-0,01736
0,049422
Дисперсия факторов
360225,4
315,5911
11,91183
0,401183
На рис. 4 представлено графическое отображение главных компонент независимых переменных.
Рисунок 4 — Главные компоненты
Модель, поостренная с помощью регрессии главных компонент, имеет вид
(3)
где — главные факторы. Главные факторы представляют комбинацию исходных факторов
(4)
Отличие главных факторов от исходных факторов заключается в том, что главнее факторы являются статистически независимыми, т.е. корреляция между ними равна нулю.
В табл. 6 показаны коэффициенты линейной регрессионной 4-х факторной модели. Если в формулу (3) подставить выражения (4), то получаем формулу, описывающую регрессионную модель в форме (1). Коэффициенты регрессионной модели в форме (1) полностью совпадают с коэффициентами классической регрессионной модели (см. табл. 1)
Таблица 6 — Характеристики регрессионной 4-х факторной модели (главные факторы)
Главные факторы
Коэффициенты регрессии
Коэффициент значимости
4.424777
394.542
1-ый фактор
0.001637
88.505
2-ый фактор
-0.002802
-4.486
3-ый фактор
0.069879
21.53
4-ый фактор
0.159117
9.077
Как видно из таблицы 6 коэффициенты первой и третьей модели являются существенно значимыми. Коэффициент, соответствующий, не является статистически значимым. Поэтому с целью улучшения качества модели построим модель на 1 и 3 главном факторе. В табл. 7 представлены коэффициенты 2-х факторной регрессионной модели. Отметим, что все коэффициенты регрессионной модели являются существенно значимыми.
Таблица 7— Характеристики регрессионной 2-х факторной модели (главные факторы)
Главные факторы
Коэффициенты регрессии
Коэффициент значимости
4,429598
369,591
1-ый фактор
0,001636
82,733
3-ый фактор
0,070071
20,184
При переходе от главных факторов к исходным факторам регрессионная модель описывается формулой (1). Коэффициенты регрессионной модели и характеристики их значимости представлены в табл. 8.
Таблица 8 — Линейная 4-х факторная регрессионная модель (исходные факторы)
Исходные факторы
Коэффициенты регрессии
Коэффициент значимости
-2,0873
-174,155
РТС
0,0021
68,3891
EURO
0,0601
20,1818
US
0,036
20,1797
OIL
-0,0012
-19,4236
В таблице 9 представлены ошибки прогнозирования, полученные на тестовой выборке, для 2-х факторной моделяи. Как видно из таблицы ошибки прогнозирования не отличаются и это говорит, что качество моделей одного уровня
Таблица 9 — Ошибки прогнозирования моделей
Число главных факторов
MAD
MSE
SSE
MAPE %
MPE %
MSEN %
1-4
0.338
0.159
0.043
8.275
-7.347
9.573
1,3
0.344
0.139
0.041
8.294
-8.294
8.359
На рис. 5 показано изменение курса доллара на тестовой выборке (пунктирная линия) и изменение курса доллара, вычисленные с помощью 3-х факторной модели
Рисунок 5 — Изменение цены на ценные бумаги на тестовой выборке (2-х факторная модель)
Выводы
В результате выполненных исследований получены следующие результаты:
1. Вычислены главные компоненты независимых переменных.
2.Построена классическая регрессионная модель:, которая показала хорошее качество на тестовой выборке.
3. Исходя из классической регрессионной модели, можно увидеть, что при увеличении индекса РТС, цены на нефть, курса доллара цена на ценные бумаги растет,а при увеличении курса евро уменьшается.
3. Построены две модели на основе регрессии главных компонент и сравнили их с классической регрессионной моделью. Показано, что использование главных компонент позволяет построить 2-х факторную модель, которая демонстрирует более высокую точность нежели классическая регрессионная модель.
4. 2х факторная модель имеет более высокие коэффициенты значимости и наименьшие ошибки прогнозирования.