Подбор закона распределения случайной величины

После расчета числовых характеристик случайной величины (математического ожидания, дисперсии, коэффициента вариации) закон распределения в первом приближении может быть определен с помощью таблицы 2.3. Для более точного определения теоретического закона распределения проводят тщательную статистическую обработку данных, например, исключают из результатов наблюдений случайные выбросы и т.д.

Под выбором теоретической кривой распределения понимается такая обработка статистических данных, когда обеспечивается подбор наиболее подходящего теоретического закона распределения, который может быть задан либо функцией распределения F(x), либо плотностью распределения f(x).

Таблица 2.3

Пределы изменения коэффициента вариации _x	Закон распределения случайной величины X
_x≤ 0.3	Нормальный
0.3 <_x< 0.4	Гамма-распределение
0.4 ≤_x< 1	Вейбулла
_x= 1	Экспоненциальное, Пуассона

Для построения теоретической кривой распределения исходный статистический материал аппроксимируется дифференциальной функцией f(x) одного из теоретических распределений. При этом выбирается такая функция f(x), которая обеспечила бы максимальное приближение эмпирических данных к теоретическим, то есть, f^*(x) ≈f(x). Для оценки правдоподобия этого приближенного равенства имеется несколько критериев согласия. Наиболее употребительными критериями согласия являются критерий Пирсона ч² и критерий Колмогорова щ.

Критерий Пирсонач². Согласно этому критерию в качестве меры расхождения между теоретическим и статистическим распределениями выбрана величина, определяемая следующим выражением:

ч² = ∑{[(m_i-n∙p_i)²] / (n∙p_i)},

^{i -1}

где: ч² - фактическое значение критерия;

m_i- эмпирическое количество значений случайной величины, попадающих вi-ый интервал;

k - число интервалов статистического ряда;

p_i - теоретическая вероятность попадания случайной величины X в i-ый интервал.

Для того чтобы выяснить, является ли полученное расхождение случайным (например, за счет ограниченного объема статистической выборки) или свидетельствует о существенной разнице, необходимо вычислить вероятность такого расхождения Д≥ч², то есть P(ч²≤Д<∞) - вероятность того, что за счет случайных причин мера расхождения теоретического и статистического распределений будет не меньше, чем фактическое значение ч².

Примечание. Величину Д можно понимать как теоретическое значение критерия Пирсона.

Величина вероятности расхождения определяется по специальным таблицам. Для "входа" в таблицу необходимо, помимо ч², рассчитать и число степеней свободыr.Число степеней свобода определяется по формуле:

r=k-s,

где: k - число интервалов статистического ряда;

s - число параметров, определяющих рассматриваемое теоретическое распределение (например, для нормального распределения, описываемого двумя параметрами s = 2).

Если искомая вероятность P(ч²≤Д<∞)окажется меньше 0.1, то выбранное теоретическое распределение обычно признается неудачным.

Примечание. Рассмотренный способ выбора теоретического закона распределения корректен при следующих условиях: объем выборки n ≥ 100; число значений (наблюдений) в каждом интервале m_i≥ 5.

Необходимо отметить, что распространены и другие способы (критерии) подбора подходящего теоретического распределения, например: критерий Колмогорова; критерий Романовского (для экспоненциального распределения, распределения Пуассона); критерий эксцесса и ассиметрии (для нормального распределения); критерий Фишера (для нормального и квазинормальных распределений).