Рассматривается задача построения регрессионной модели для изучения зависимости чистого дохода США (в рублях) от следующих параметров: оборот капитала, использование капитала и численности служащих.
Цель исследования – разработать модели для чистого дохода США на среднесрочную перспективу. Для достижения цели поставлены следующие основные задачи:
Классическая регрессионная модель
Строится классическая регрессионная модель, которая описывается выражением (1). Диапазон наблюдений 793 точек за 39 месяцев.
Рисунок 1 — Изменение чистого дохода США
Коэффициенты регрессионной модели показаны в табл. 1. Первая строка таблицы содержит значение для коэффициента .
Таблица 1 — Линейная регрессионная 4-х факторная модель
Исходные факторы
Коэффициенты регрессии
Коэффициент значимости
-3,314791
-14,029
Индекс РТС
0,002281
65,100
Курс доллара
-0,172398
11,407
Курс евро
-0,021690
-2,304
Цена на нефть
0,003899
3,649
Коэффициент детерминации модели 0,961.
Модель адекватная, т.к. R- коэффициента детерминации близок к единице.
Построенная модель проверяется на диапазоне, который не использовался при построении регрессионной модели, с 700 по 793 месяц. Прогнозные значения сравниваются с исходными данными. В результате вычислены шесть видов ошибок:
· Средняя абсолютная ошибка в процентах (Mean Absolute Percentage Error, МАРЕ)
· Средняя процентная ошибка (Mean Percentage Error, MPE).
· Стандартная ошибка оценки (Mean Standart Error MSEN)
Ошибки, полученные на тестовой выборке, представлены в табл. 2. На рис. 2 показано изменение курса доллара на тестовой выборке (пунктирная линия) и изменение курса доллара, вычисленные с помощью 4-х факторной модели.
Таблица 2 — Ошибки прогнозирования моделей
Число исходных факторов
MAD
MSE
SSE
MAPE %
MPE %
MSEN %
0.338
0.159
0.043
8.275
-7.347
9.573
Рисунок 2 — Изменение средневзвешенной стоимости ценных бумаг на тестовой выборке (4-х факторная модель)
Анализ значимости коэффициентов регрессионной модели показывает, что коэффициент для фактора курс евро и курс доллара является статистически незначимым (при уровне значимости 1%). Поэтому улучшение модели ведется в направлении уменьшения число независимых факторов путем исключения курса доллара и курса евро. В результате получаем 2-х факторную регрессионную модель с коэффициентом детерминации 0,929.
В табл. 3 представлены значения 2-х факторной модели. Как видно из таблицы все коэффициенты являются статистически значимыми. Анализ коэффициентов регрессионной модели показывает, что рост ценных бумаг увеличивает индекс РТС.
Таблица 3 — Характеристики регрессионной 2-х факторной модели
Исходные факторы
Коэффициенты регрессии
Коэффициент значимости
1,943753
39,674
Индекс РТС
0,001718
50,539
Цена на нефть
-0,002827
-3,386
Получен
В табл. 4 представлены значения ошибок для 4-х факторной и 2-х факторной моделей, а на рис. 3 — изменение стоимости ценных бумаг по 2-х факторной модели(сплошная линия) и фактические значения (пунктирная линия).
Таблица 3 — Ошибки прогнозирования моделей
Число исходных факторов
MAD
MSE
SSE
MAPE %
MPE %
MSEN %
0.338
0.159
0.043
8.275
-7.347
9.573
0.151
0.032
0.019
3.665
-1.291
4.303
Рисунок 3 — Изменение стоимости ценных бумаг на тестовой выборке (2-х факторная модель)