По данным, полученным от 40 промышленных предприятий одного из регионов, изучается зависимость объема выпуска продукции Y (млн. руб.) от четырех факторов:
X1 – численность промышленно-производственного персонала, чел.
X2 – среднегодовая стоимость основных фондов, млн. руб.
X3 – электровооруженность 1 чел.-ч., кВт×ч.
X4 – прибыль от реализации продукции, млн. руб.
№
Y
X1
X2
X3
X4
13,9
55,3
5,7
87,2
56,2
27,6
31,1
60,5
33,5
35,1
26,5
4,4
-1437
24,9
13,2
-9135
14,9
2,4
5,8
50,4
4,9
25,9
43,5
3,1
0,6
43,1
0,7
0,2
6,6
4,8
48,7
17,8
3,0
20,8
23,9
27,5
33,2
23,1
35,1
32,5
37,2
33,8
-5192
Требуется:
1. Построить матрицу парных коэффициентов корреляции. Выполнить тест на мультиколлинеарность Фаррара – Глоубера. Обосновать отбор факторов для регрессионного анализа.
2. Построить уравнение регрессии. Дать экономическую интерпретацию коэффициентов регрессии.
3. Привести график остатков. Проверить условие гомоскедастичности остатков.
4. Рассчитать прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
5. Рассчитать ошибки и доверительный интервал прогноза для уровня значимости 5% или 10% ( = 0,05; = 0,1).
Вариант 2
По данным, представленным в таблице, исследуется зависимость между величиной накладных расходов Y (млн. руб.) 40 строительных организаций и следующими тремя основными факторами:
x1 – объемом выполненных работ, млн. руб.
x2 – численностью рабочих, чел.
x3 – фондом зарплаты, млн. руб.
№
Y
5,7
26,9
12,250
5,0
24,5
10,627
4,5
18,4
6,865
4,0
18,1
6,964
4,4
18,1
7,622
3,5
17,9
6,291
3,5
15,7
7,980
3,8
14,2
6,770
5,1
13,3
7,105
3,4
15,0
5,762
4,1
14,7
6,096
4,1
13,3
6,056
3,1
14,6
4,921
2,8
11,7
4,131
2,1
10,6
4,384
2,5
10,0
4,157
2,0
9,0
4,324
2,4
9,5
4,023
2,3
7,0
3,315
2,4
9,1
3,619
2,5
6,8
3,461
2,2
5,5
2,139
1,6
5,1
2,244
3,4
12,2
3,958
2,7
11,0
3,337
3,2
9,3
3,676
2,9
5,9
2,120
4,8
25,9
10,649
3,7
23,5
6,806
4,4
19,8
9,240
3,7
18,8
8,860
4,8
19,1
7,354
3,7
18,8
5,289
3,6
17,4
5,830
4,0
14,1
6,265
3,8
13,8
5,396
3,7
13,7
5,194
4,1
13,8
4,608
2,4
13,9
5,856
2,5
10,6
7,326
Требуется:
1. Построить матрицу парных коэффициентов корреляции. Выполнить тест на мультиколлинеарность Фаррара – Глоубера. Обосновать отбор факторов для регрессионного анализа.
2. Построить уравнение множественной регрессии.
3. Оценить качество уравнения регрессии с помощью коэффициента детерминации R2, индекса корреляции. Оценить точность модели.
4. Оценить статистическую значимость уравнения регрессии, используя критерий Фишера F (a =0,05) и статистическую значимость параметров регрессии, используя критерий Стьюдента.
5. Дать сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, b - и D - коэффициентов.
6. Рассчитать прогнозное значение результата, если прогнозные значения факторов составляют 70% от их максимальных значений.
Вариант 2
По предприятию легкой промышленности оценивается эффективность использования активов. Для этой цели анализируется зависимость квартальной выручки от продажи товаров, продукции, работ и услуг (Y) от среднеквартальной стоимости внеоборотных и оборотных активов (переменные X1 и X2 соответственно). Имеются данные за три года, млн. руб.:
Год
Квартал
Y
X1
X2
Требуется:
1. Построить матрицу парных коэффициентов корреляции между исследуемыми переменными. Проверить значимость коэффициентов корреляции. Проверить факторы на коллинеарность.
2. Построить уравнение линейной регрессии выручки от продаж в зависимости от среднеквартальной стоимости внеоборотных и оборотных активов.
3. Проверить статистическую значимость уравнения и его коэффициентов на уровне значимости a=0,05. Сделать вывод о существенном либо несущественном влиянии изменения стоимости активов на изменение выручки от продаж.
4. Оценить точность модели.
5. Дать экономическую интерпретацию уравнения регрессии и оценить степень влияния каждой из группы активов на выручку от продаж. (вычислить коэффициенты эластичности, β-коэффициенты, ∆-коэффициенты).
6. Построить прогноз квартальной выручки от продажи товаров, продукции, работ и услуг на два следующих квартала.
Вариант 4
По машиностроительному предприятию оценивается эффективность использования материальных и трудовых ресурсов. Для этой цели анализируется зависимость годового объема выпускаемой продукции (Y, млн. руб.) от среднегодовой стоимости основных средств (X1, млн. руб.) и среднегодовой численности работников предприятия (X2, чел.). Имеются данные за десять лет:
Год
Y
X1
X2
405,3
41,8
1305,2
428,1
66,3
1330,1
423,9
69,6
1295,3
433,2
76,8
1302,9
456,5
89,4
1334,1
464,7
95,3
1320,7
542,1
92,9
1303,5
599,9
95,1
1456,9
599,2
122,5
1478,2
576,5
135,9
1390,3
Требуется:
1. Построить матрицу парных коэффициентов корреляции между исследуемыми переменными. Проверить факторы на коллинеарность.
2. Построить уравнение линейной регрессии объема выпускаемой продукции, без включения фактора времени и с включением фактора времени для учета тренда.
3. Проверить статистическую значимость уравнения и его коэффициентов на уровне значимости a=0,05. Сделать выводы о существенном либо несущественном влиянии факторных переменных X1 и X2 на изменение объема выпускаемой продукции и о целесообразности включения фактора времени в регрессионную модель.
4. Оценить точность модели.
5. Дать экономическую интерпретацию уравнения регрессии.
6. Построить прогноз годового объема выпускаемой продукции на следующий год.
Вариант 5
Исследуется влияние некоторых показателей социально-экономического положения субъектов Центрального федерального округа России на региональный коэффициент смертности. В таблице приводятся официальные статистические данные по субъектам Центрального федерального округа за 2005 год («Российская газета», 24 марта 2006 года, № 60), где:
· Y — коэффициент смертности в 2006 году (выражается в промилле «‰» и представляет собой число умерших за год на 1000 человек населения);
· X1 — индекс (темп роста) промышленного производства, в % к 2004 году;
· X2 — индекс производства продукции сельского хозяйства, в % к 2004 году (для г. Москвы условно принято 100 %);
· X3 — численность работников малых предприятий, ‰ (чел. на 1000 чел. населения);
· X4 — среднемесячная номинальная начисленная заработная плата по региону, тыс. руб.;
· X5 — численность населения на 1 января 2005 года, тыс. чел.
Требуется:
1. Построить матрицу парных коэффициентов линейной корреляции и выявить коллинеарные факторы.
2. Построить линейную регрессионную модель коэффициента смертности, обосновав отбор факторов. Если из-за коллинеарности факторов невозможно построить уравнение регрессии с полным перечнем факторов, то построить несколько моделей.
3. Оценить качество построенных моделей.
4. Дать экономическую интерпретацию параметров лучшего уравнения регрессии и оценить вклад каждого из факторов в вариацию коэффициента смертности с помощью дельта – коэффициентов.
5. Построить три однофакторные нелинейные регрессионные модели зависимой переменной с наиболее подходящим фактором: степенную, гиперболическую и показательную. Сравнить качество моделей. Выбрать лучшую модель.
Примечание. При проверке статистических гипотез уровень значимости a принять равным 0,05.
Область
Y
X1
X2
X3
X4
X5
1. Белгородская
16,0
108,8
115,8
35,4
6,86
2. Брянская
19,8
116,0
95,7
25,0
5,24
3. Владимирская
20,3
100,2
113,3
43,1
6,07
4. Воронежская
18,8
109,6
102,1
53,3
5,60
5. Ивановская
22,0
107,6
96,8
36,5
5,37
6. Калужская
19,2
105,0
94,7
58,4
6,98
7. Костромская
21,0
108,4
100,3
30,1
5,84
8. Курская
19,7
104,0
101,1
29,8
5,65
9. Липецкая
17,9
102,5
108,2
33,6
7,19
10. Московская
17,5
129,6
101,2
61,5
9,51
11. Орловская
18,5
110,3
101,7
28,4
5,46
12. Рязанская
20,3
106,2
100,9
49,4
6,22
13. Смоленская
21,5
104,3
92,3
26,3
6,30
14. Тамбовская
19,3
102,5
110,0
25,6
5,08
15. Тверская
23,1
104,4
93,0
34,5
6,64
16. Тульская
22,0
105,0
102,7
36,4
6,34
17. Ярославская
19,9
104,5
105,9
43,3
7,39
18. г. Москва
12,4
122,4
100,0
168,9
13,74
Вариант 6
По тринадцати супермаркетам исследуется зависимость квартального торгового оборота от размера торговых площадей, района расположения (центральный или периферийные) и формы собственности (муниципальный или частный). Имеются следующие данные:
№ магазина
Торговый оборот (млн. руб.)
Торговые площади (м2)
Район расположения
Форма собственности
периферийный
муниципальный
периферийный
частный
центральный
муниципальный
центральный
муниципальный
центральный
частный
периферийный
муниципальный
центральный
муниципальный
периферийный
муниципальный
центральный
частный
центральный
частный
центральный
муниципальный
периферийный
частный
центральный
частный
Требуется:
1. Проанализировать тесноту и направление связи между переменными, отобрать факторы для регрессионного анализа.
2. Построить линейную регрессионную модель торгового оборота магазина, не содержащую коллинеарных факторов. Оценить параметры модели.
3. Существенна ли разница в торговом обороте магазинов: а) расположенных в центральном и периферийных районах города; б) частных и муниципальных?
4. Соответствуют ли остатки регрессии нормальному закону распределения?
5. Выполняется ли условие гомоскедастичности?
6. Спрогнозировать значение торгового оборота муниципального магазина с торговой площадью 4000 м2, расположенного в центральном районе города.
Вариант 7
По хладокомбинату изучается зависимость месячного объема реализации мороженного от средней цены выпускаемой продукции, затрат на рекламу, среднемесячной температуры воздуха и месячного темпа инфляции. Имеются данные за двенадцать месяцев:
Месяц
Объем реализации (тыс. руб.)
Цена (руб.)
Затраты на рекламу (тыс. руб.)
Температура воздуха (°С)
Темп инфляции (%)
8,3
0,3
8,3
0,4
8,9
0,3
10,6
0,2
10,7
0,7
10,8
0,9
12,2
0,9
14,2
0,4
14,5
0,1
13,7
0,1
13,3
0,5
12,1
0,9
Требуется:
1. Проанализировать тесноту и направление связи между переменными, отобрать факторы для регрессионного анализа.
2. Построить линейную регрессионную модель объема реализации мороженного, не содержащую коллинеарных факторов. Оценить параметры модели. Значимо ли статистически уравнение регрессии и его коэффициенты?
3. Присутствует ли в остатках регрессии автокорреляция первого порядка?
4. Приемлема ли точность регрессионной модели?
5. Изменение, какого из факторов сильнее всего влияет на изменение объема реализации мороженного? Оценить вклад каждого из факторов в вариацию объёма прибыли с помощью дельта – коэффициентов.
6. Спрогнозировать значение объема реализации мороженного на следующий месяц в зависимости от прогнозных значений влияющих факторов.
Вариант 8
По четырнадцати страховым компаниям имеются данные, характеризующие зависимость чистой годовой прибыли от годовых размеров собственных средств, страховых резервов, страховых премий и страховых выплат (все в тыс. руб.):
№ компании
Годовая прибыль
Собственные средства
Страховые резервы
Страховые премии
Страховые выплаты
Требуется:
1. Построить линейную регрессионную модель годовой прибыли страховой компании, не содержащую коллинеарных факторов. Оценить параметры модели.
2. Значимы ли статистически уравнение регрессии и его коэффициенты?
3. Имеют ли остатки регрессии одинаковую дисперсию?
4. Приемлема ли точность регрессионной модели?
5. Дать экономическую интерпретацию коэффициентам уравнения регрессии.
6. Изменение, какого из факторов сильнее всего влияет на изменение годовой прибыли?
7. Используя результаты регрессионного анализа ранжировать компании по степени эффективности.
Вариант 9
Строится модель цены автомобиля на вторичном рынке в зависимости от пробега, срока эксплуатации и объема двигателя. Имеются данные по пятнадцати автомобилям одной и той же модели:
№ автомобиля
Цена автомобиля (долл. США)
Пробег (тыс. км)
Срок эксплуатации (лет)
Объем двигателя (л)
2,3
1,9
1,8
2,1
2,6
1,7
2,4
1,9
1,9
1,7
2,2
2,4
2,3
2,5
2,6
Требуется:
1. Построить матрицу парных коэффициентов линейной корреляции. Выполнить тест Фаррара – Глоубера на мультиколлинеарность.
2. Построить линейную регрессионную модель цены автомобиля, обосновав отбор факторов. Оценить параметры модели.
3. Оценить качество построенной модели.
4. Упорядочит факторы по степени их влияния на изменение цены автомобиля.
5. Спрогнозировать цену автомобиля с пробегом 150 тыс. км, сроком эксплуатации 10 лет и объемом двигателя 2 л.
Вариант 10
По четырнадцати страховым компаниям исследуется зависимость месячной прибыли от численности страховых агентов, затрат на рекламу и расположения офиса компании (центральный или периферийный районы города):
№ компании
Прибыль (тыс. руб.)
Численность страховых агентов (чел.)
Затраты на рекламу (тыс. руб.)
Район расположения
периферийный
центральный
периферийный
периферийный
периферийный
периферийный
центральный
периферийный
центральный
периферийный
периферийный
периферийный
периферийный
центральный
Требуется:
1. Построить линейную регрессионную модель прибыли страховой компании методом пошагового исключения факторов.
2. Оценить качество построенной модели.
3. Существенна ли разница в прибыли компаний, офисы которых расположены в центральном и периферийных районах города?
4. Изменение, какого из факторов сильнее всего влияет на изменение прибыли? Оценить вклад каждого из факторов в вариацию объёма прибыли с помощью дельта – коэффициентов.
5. Используя результаты регрессионного анализа ранжировать компании по степени эффективности.
6. Спрогнозировать месячную прибыль страховой компании, если прогнозные значения факторов равны своим средним значениям, а офис расположен: а) в центре города; б) на окраине.
Вариант 11
По хлебобулочному предприятию исследуется зависимость месячного объема реализованной продукции от затрат в предыдущем месяце на теле-, радио-, газетную и наружную рекламу. Имеются данные за двенадцать месяцев:
Месяц
Объем реализованной продукции (тыс. руб.)
Затраты на рекламу (тыс. руб.)
телерекламу
радиорекламу
газетную рекламу
наружную рекламу
Требуется:
Построить линейную регрессионную модель объема реализованной продукции, не содержащую коллинеарных факторов. Оценить параметры модели.
Какая доля вариации объема реализованной продукции объясняется вариацией факторов, включенных в модель регрессии?
Присутствует ли в остатках регрессии автокорреляция первого порядка?
Можно ли считать остатки случайными?
Приемлема ли точность регрессионной модели?
Изменение, какого из факторов сильнее всего влияет на изменение объема реализованной продукции? Оценить вклад каждого из факторов в вариацию объема реализованной продукции с помощью дельта – коэффициентов.
Спрогнозировать значение объема реализованной продукции на следующие два месяца.
Вариант 12
Исследуется взаимосвязь курса доллара США с курсами евро, японской иены и английского фунта стерлингов. Имеются данные об официальных курсах валют, установленных Центральным Банком России, за двенадцать дней:
День
Доллар США (руб./долл.)
Евро (руб./евро)
Японская иена (руб./100 иен)
Английский фунт (руб./фунт)
28,12
36,13
26,97
52,63
28,18
35,97
26,80
52,32
28,13
35,97
26,77
52,26
28,08
36,00
26,63
52,28
28,06
36,13
26,53
52,43
28,03
36,28
26,70
52,58
28,02
36,34
26,67
52,90
28,00
36,47
26,63
52,99
27,99
36,54
26,60
52,81
27,93
36,50
26,50
52,89
27,95
36,52
26,55
52,62
27,97
36,54
26,52
52,67
Требуется:
1. Построить матрицу парных коэффициентов линейной корреляции. Выполнить тест Фаррара – Глоубера на мультиколлинеарность.
2. Построить линейную регрессионную модель курса доллара США, обосновав отбор факторов. Оценить параметры модели. Оценить качество построенной модели.
3. Изменение курсов каких валют существенно влияет на изменение курса доллара США? Изменение, какого из факторов сильнее всего влияет на изменение курса доллара США? Оценить вклад каждого из факторов в вариацию курса доллара США с помощью дельта – коэффициентов.
4. Присутствует ли в остатках регрессии автокорреляция первого порядка?
5. Можно ли считать остатки случайными?
6. Спрогнозировать курс доллара на следующие два дня.
Вариант 13
По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%) .
Номер предприятия
Номер предприятия
3,6
6,3
3,5
6,4
3,9
7,4
4,1
7,5
3,9
7,9
4,5
8,2
5,3
5,3
8,6
5,6
9,5
6,8
Требуется:
1. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
2. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
3. Предполагая прогнозные значения переменных равными =7 и =35, найти с вероятностью 0,90 доверительный интервал для прогнозного значения выработки продукции на одного работника.
4. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
5. Построить три однофакторные нелинейные регрессионные модели зависимой переменной с наиболее подходящим фактором: степенную, гиперболическую и показательную. Привести графики всех моделей.
6. Сравнить качество моделей. Выбрать лучшую модель.
Вариант 14
По 11 металлообрабатывающим цехам машиностроительного предприятия изучается зависимость фактических затрат на 1 рубль валовой продукции от среднего уровня производительности труда (отношение объема продукции в денежном выражении к затратам труда на ее изготовление) и средней энергоотдачи(отношение объема продукции в денежном выражении к затратам электроэнергии на ее изготовление). Имеются данные за последний квартал:
№ цеха
Затраты на 1 рубль валовой продукции (руб.)
Уровень производительности труда (руб./чел.‑ч)
Энергоотдача (руб./кВт‑ч)
0,38
0,53
0,49
0,35
0,23
0,52
0,44
0,34
0,42
0,48
0,53
Требуется:
1. Проверить, связаны ли между собой показатели значимыми парными линейными зависимостями.
2. Построить все возможные линейные регрессионные модели затрат, оценить параметры моделей и выбрать одну из них в качестве лучшей.
3. Можно ли использовать лучшую модель для целей анализа и прогнозирования затрат?
4. Приемлема ли точность лучшей модели?
5. Рассчитать затраты на 1 рубль валовой продукции, если прогнозные значения факторов на 25 % превышают свои средние значения.
6. Построить три однофакторные нелинейные регрессионные модели зависимой переменной с наиболее подходящим фактором: степенную, гиперболическую и показательную. Привести графики всех моделей.
7. Сравнить качество моделей. Выбрать лучшую модель.
Примечание. Там, где это необходимо, уровень значимости принять равным a=0,05.
Вариант 15
Исследуется зависимость цены системного блока компьютера от тактовой частоты процессора, размера оперативной памяти и наличия DVD-накопителя. Имеются данные по 13 компьютерам:
№ компьютера
Цена системного блока (руб.)
Тактовая частота процессора (МГц)
Оперативная память (Мбайт)
DVD-накопитель
отсутствует
имеется
отсутствует
отсутствует
имеется
отсутствует
отсутствует
имеется
отсутствует
имеется
отсутствует
отсутствует
отсутствует
Требуется:
1. Построить линейную регрессионную модель цены системного блока компьютера, не содержащую коллинеарных факторов. Оценить параметры модели. Если имеется возможность построить несколько моделей, то выбрать одну из них в качестве лучшей.
2. Дать экономическую интерпретацию коэффициентам уравнения регрессии.
3. Существенно ли влияет на цену системного блока:
- тактовая частота процессора;
- размер оперативной памяти;
- наличие или отсутствие DVD-накопителя?
Дать количественные соотношения.
4. Имеют ли остатки регрессии одинаковую дисперсию?
5. Приемлема ли точность регрессионной модели?
6. Рассчитать стоимость системного блока, если тактовая частота процессора составляет 3000 МГц, оперативная память — 256 Мбайт, а DVD-накопитель:
- имеется;
- отсутствует.
Вариант 16
Исследуется зависимость цены квартиры от размера ее общей площади, типа дома (кирпичный или панельный) и этажа, на котором расположена квартира (средний или крайний). Имеются данные по 16 квартирам в домах, расположенных в одном и том же районе города:
№ квартиры
Цена квартиры (долл. США)
Общая площадь (м2)
Тип дома
Этаж
панельный
крайний
кирпичный
крайний
кирпичный
крайний
панельный
крайний
кирпичный
средний
кирпичный
крайний
кирпичный
крайний
панельный
средний
кирпичный
крайний
кирпичный
средний
кирпичный
крайний
панельный
крайний
кирпичный
средний
кирпичный
средний
кирпичный
средний
панельный
крайний
Требуется:
1. Построить линейную регрессионную модель цены квартиры, не содержащую коллинеарных факторов на уровне значимости a=0,05. Оценить параметры модели. Если имеется возможность построить несколько моделей, то выбрать одну из них в качестве лучшей.
2. Значимо ли уравнение регрессии и его коэффициенты на уровне значимости a=0,01?
3. Какая доля вариации цены квартиры объясняется вариацией факторов, включенных в модель?
4. Приемлема ли точность модели?
5. Выполняется ли условие гомоскедастичности остатков?
6. Что в большей степени влияет на цену квартиры — тип дома или этаж, на котором она расположена? Оценить вклад каждого из факторов в вариацию цены квартиры с помощью дельта – коэффициентов.
7. Спрогнозировать среднюю цену квартиры общей площадью 80 м2, расположенной в панельном доме на одном из крайних этажей.
Вариант 17
По торговой фирме исследуется влияние стажа работы, уровня образования и пола менеджера по продаже на размер дохода от реализации товаров, принесенного фирме за последний год. Имеются сведения по 10 менеджерам:
Менеджер
Доход (млн. руб.)
Стаж (лет)
Образование
Пол
1. Иванова
высшее
женский
2. Петров
среднее
мужской
3. Кузнецов
высшее
мужской
4. Светлова
среднее
женский
5. Сидоренко
высшее
женский
6. Калинин
высшее
мужской
7. Крымова
высшее
женский
8. Жуков
высшее
мужской
9. Баранова
среднее
женский
10. Семенов
высшее
мужской
Требуется:
1. Построить линейную регрессионную модель дохода с полным набором факторов. Оценить параметры модели.
2. Пригодно ли уравнение регрессии для целей анализа и прогнозирования?
3. Существенна ли разница в размере дохода, принесенного менеджерами с высшим и средним образованием?
4. Существенна ли разница в размере дохода, принесенного мужчинами и женщинами?
5. Построить линейную регрессионную модель только со статистически значимыми факторами. Оценить параметры модели. Дать экономическую интерпретацию коэффициентам уравнения регрессии.
6. Оценить точность построенной модели.
7. Спрогнозировать средний доход менеджера с высшим образованием со стажем работы 7 лет.
Примечание. Там, где это необходимо, уровень значимости принять равным a=0,05.
Вариант 18
По данным, представленным в таблице, исследуется зависимость между величиной накладных расходов 40 строительных организаций Y (млн. руб.) и следующими тремя основными факторами:
x1 – объемом выполненных работ, млн. руб.
x2 – численностью рабочих, чел.
x3 – фондом зарплаты, млн. руб.
№
Накладные расходы, млн. руб.
Объем работ, млн. руб.
Численность рабочих, чел.
Фонд заработной платы рабочих, млн. руб.
3,5
11,9
5,754
4,0
12,1
5,820
3,1
11,2
4,267
2,7
10,8
4,581
3,6
11,7
5,190
2,7
11,8
4,830
2,9
9,8
4,518
1,6
2,8
0,840
1,3
5,9
2,150
2,5
8,7
2,482
2,1
7,6
3,231
2,4
7,3
2,060
2,0
7,9
3,212
2,5
8,9
3,634
1,8
5,4
2,125
2,8
10,2
3,008
4,0
25,1
9,213
3,9
22,7
8,990
4,7
20,3
6,265
4,8
19,9
7,347
4,3
18,2
7,524
3,5
17,3
6,642
3,0
16,5
5,833
3,6
17,0
12,059
3,3
17,1
7,051
2,9
16,2
6,404
3,1
17,3
5,575
2,8
16,3
5,019
3,5
12,9
10,485
4,6
13,8
5,820
3,5
10,1
5,116
2,9
10,9
5,510
2,7
11,4
5,200
2,8
11,3
4,455
3,0
8,7
4,488
2,9
10,0
4,968
2,4
5,2
4,022
1,6
7,4
1,570
1,2
2,2
1,142
1,5
2,6
0,429
Требуется:
1. Осуществить двумя способами выбор факторных признаков для построения регрессионной модели:
а) на основе анализа матрицы коэффициентов парной корреляции, включая проверку гипотезы о независимости объясняющих переменных (тест на выявление мультиколлинеарности Фаррара-Глоубера);
б) с помощью пошагового отбора методом исключения.
2. Дать экономическую интерпретацию коэффициентам уравнения регрессии.
3. Дать сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, b- и D - коэффициентов.
Провести тестирование ошибок уравнения регрессии на гетероскедастичность, используя тест Голдфельда –Квандта.
4. Рассчитать прогнозное значение результата, если прогнозные значения факторов составляют 75% от их максимальных значений.
5. Построить доверительные интервалы (с вероятностью 95%) для предсказанных значений накладных расходов и определить компании, в которых фактические значения накладных расходов завышены.
Вариант 19
Исследуется влияние некоторых показателей социально-экономического положения субъектов Центрального федерального округа России на региональный на индекс потребительских цен. В таблице приводятся официальные статистические данные по субъектам Центрального федерального округа Российской Федерации за 2005 год («Российская газета», 24 марта 2006 года, № 60).
В таблице приняты следующие обозначения: переменные Y, X1, X2, X3 представляют собой индексы потребительских цен в декабре 2005 года, выраженные в процентах к декабрю 2004 года: Y — общий, X1 — на продовольственные товары, X2 — на непродовольственные товары, X3 — на платные услуги населению. Переменные X4 и X5 — это соответственно среднемесячная номинальная начисленная заработная плата в 2005 году (тыс. руб.) и численность населения региона на 1 января 2005 года (тыс. чел.). Переменная Y рассматривается как результативная, переменные X1, X2, X3, X4, X5 — как факторные.
Область
Y
X1
X2
X3
X4
X5
Белгородская
112,6
110,5
106,1
126,2
6,86
Брянская
111,9
109,2
108,3
126,8
5,24
Владимирская
110,9
107,7
104,7
126,9
6,07
Воронежская
109,7
108,8
105,9
120,9
5,60
Ивановская
108,7
106,0
107,2
116,6
5,37
Калужская
111,2
109,1
108,7
120,9
6,98
Костромская
109,2
106,6
105,1
123,4
5,84
Курская
109,4
107,7
106,1
116,9
5,65
Липецкая
110,9
109,0
106,3
125,4
7,19
Московская
111,3
107,5
105,6
126,8
9,51
Орловская
109,5
107,5
106,1
122,4
5,46
Рязанская
110,1
109,7
106,1
118,4
6,22
Смоленская
111,9
110,3
107,5
122,4
6,30
Тамбовская
109,8
109,8
106,7
115,0
5,08
Тверская
110,9
108,7
105,2
125,6
6,64
Тульская
110,8
108,0
106,7
126,1
6,34
Ярославская
112,3
109,2
106,6
130,6
7,39
г. Москва
110,4
109,5
105,8
118,1
13,74
Требуется:
1. Построить матрицу парных коэффициентов линейной корреляции и выявить наличие либо отсутствие коллинеарности факторов.
2. Построить линейную регрессионную модель общего индекса потребительских цен, не содержащую коллинеарных факторов. Проверить статистическую значимость уравнения регрессии и его параметров. Сделать выводы о существенности либо несущественности влияния каждого из факторов на общий индекс потребительских цен.
3. Построить линейную регрессионную модель общего индекса потребительских цен, включающую в себя только факторы, оказывающие существенное влияние на результативную переменную. Оценить качество модели.
4. Дать экономическую интерпретацию параметров уравнения регрессии и оценить вклад каждого из факторов в общий индекс потребительских цен с помощью дельта–коэффициентов.
5. Для анализа влияния населенности региона на средний уровень доходов его жителей построить линейную модель регрессионной зависимости среднемесячной заработной платы X4 от численности населения X5. Проверить статистическую значимость уравнения регрессии и оценить среднюю эластичность изменения заработной платы в зависимости от числа жителей.
6. Используя результаты регрессионного анализа, выявить наиболее привлекательные регионы.
Вариант 20
Исследуется влияние объема промышленного производства и размера инвестиций в основной капитал на региональный коэффициент смертности. В таблице приводятся официальные статистические данные по субъектам Центрального федерального округа за 2005 и 2006 года («Российская газета» от 24.03.2006 г., № 60 и от 14.03.2007 г. № 51), где:
· Y — коэффициент смертности в 2006 году (выражается в промилле «‰» и представляет собой число умерших за год на 1000 человек населения);
· X1 — индекс (темп роста) инвестиций в основной капитал в 2005 году (в % к 2004 году);
· X2 — индекс промышленного производства в 2006 году (в % к 2005 году);
· X3 — индекс инвестиций в основной капитал в 2006 году (в % к 2005 году).