русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

ТЕМА3. ПРИМЕНЕНИЕ КОРРЕЛЯЦИОННО-РЕГРЕССИОНЫХ МОДЕЛЕЙ В ПРОГНОЗИРОВАНИИ


Дата добавления: 2013-12-24; просмотров: 1111; Нарушение авторских прав


технология построения корреляционных моделей проходит несколько этапов:

  1. постановка задачи
  2. сбор исходной информации
  3. предварительная обработка исходной информации
  4. построение модели
  5. оценка адекватности и точности построенных моделей.

Если случайные величины X,Y некоррелированы, то произведение отклонений (xi-x¯)*(yi-y¯) будет носить случайный характер с математическим ожиданием à к 0. В этом случае ζxy = 1 (отклонения будут упорядочены).

В конкретных исследованиях работают с выборочной совокупностью. Всегда выборочная совокупность меньше, чем генеральная. В результате всегда получаем характеристики худшие чем те, если бы имели в распоряжении генеральную совокупность. В результате работы с выборочной совокупностью, мы вынуждены подбирать закон распределения. Это называется выравниванием статистического ряда. В результате выравнивания имеют 2 гипотезы:

1. расхождение между теоретическим законом распределения и статистическим распределением объясняется случайными обстоятельствами, связанными с ограниченным числом наблюдений

2. расхождения являются существенными и связано с тем, что теоретическое распределение плохо выравнивает подобранное статистическое.

Для проверки гипотез служит критерий согласия. Наиболее часто используется х Пирсона, т2 Стьюдента f-критерий Фишера. Согласно этим критериям вычисляется мера расхождения между теоретическими и статистическими расхождениями.

При малом количестве наблюдений рекомендуется выявить доверительный интервал и доверительную вероятность.

Доверительный интервал рассчитывают только для несмещенных оценок, то есть оценок которые совпадают со статистическим данными средними

Постановка задачи – наиболее важный момент в построении корреляционных моделей. От точности поставленной задачи в дальнейшем будет зависеть вся работа. В качестве уточнения постановки задачи проводится теоретический и логический анализ результирующего и определяющего факторов. Здесь определяются границы выборочной совокупности и определяется круг факторов, которые будут исследоваться.



Сбор исходной информации. Самая трудоемкая работа. Исходная информация формируется в виде таблиц, в которых содержатся значения результирующего и определяющих факторов.

После завершения сбора исходной информации приступают к статистической оценке значимости факторов. Статистическая оценка значимости проводится путем расчета коэффициентов парной корреляции. В результате получаются корреляционные матрицы, которые потом подвергаются визуальному анализу.

Следующий шаг - построение эмпирических уравнений регрессии (для определения характера влияния определяющих факторов на результирующий). Для каждого факторного признака Xij на график наносятся точки с координатами yi xij

Затем определяется минимальное и максимальное значение X и Y. Отрезок [xjmin, xjmax] делится на ряд интервалов. В результате получаем

∆x = (xjmax - xjmin) \ N

N – число интервалов.

Для каждого интервала (т.е. ∆x) определяется точка со средним значением у, х. Затем на графике эти средние значения соединяются отрезками, мы получаем эмпирическую линию регрессии, при необходимости эта линия регрессии может быть сглажена. В результате получаем некоторую линию, которая отражает характер влияния определяющего фактора на результирующий. Зная характер зависимости, можно выбрать форму сглаживающей кривой. На этом этап предварительной обработки информации заканчивается.

Расчетный этап. Как правило, в социально-экономических исследованиях используют многофакторные модели, но в некоторых случаях полезными являются и однофакторные модели. Однофакторные модели, как правило, строятся при помощи метода наименьших квадратов. Зависимости, которые используются:

  • линейная у = а0 + а1х
  • степенная у = а0хa1
  • у = a0 * ea1x

Следующий шаг – построение многофакторной модели. В качестве основных сглаживающих функций выступают линейные многочлены и мультистепенные функции

Метод расчета – метод наименьших квадратов. Расчеты могут осуществляться в матричной форме. При необходимости в начале проводят процедуру выравнивания.

Затем проводится оценка адекватности и точности построения моделей.

Адекватность полученных моделей, оценивается при помощи нескольких показателей. Полноту учета всех факторов, влияющих на результирующий признак характеризует коэффициент множественной корреляции, он определяется:

________

R = √1 – D\Dy

 

D0 – остаточная дисперсия, т.е. это характеристика, которая показывает рассеяние случайной величины

Yi – относительную уравнения регрессии

Dy - дисперсия Y относительно среднего значения

 

Используется коэффициент детерминации – это коэффициент множественной корреляции в квадрате (R ),он показывает долю изменчивости результативного признака за счет всех факторов, включенных в модель. Точность модели можно оценить по средней относительной ошибке.

n

Scp = 1\n Σ |(yi - ypi)| * 100%\yi

i=1

Sср показывает на сколько процентов расчетные значения в среднем отклоняются от фактических. Можно рассчитать доверительный интервал, который показывает пределы возможных значений у. Величина доверительного интервала определяется:

∆ = y ± tσ*

t – доверительная вероятность, которая зависит от уровня риска

σ – среднеквадратическое отклонение i-го расчетного значения у от фактического.

При этом считается, что yi распределены по нормальному закону с одинаковой дисперсией, а за ее оценку принимается значение остаточной дисперсии.

Для оценки адекватности используются также критерии согласия. Могут использоваться критерии Фишера, Стьюдента, Пирсона и др.

 

 


 



<== предыдущая лекция | следующая лекция ==>
ТЕМА2. ЭКСТРАПОЛЯЦИОННЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ. | ТЕМА 4. ЭКСПЕРТНЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.004 сек.