Полигон частот иногда называют эмпирической функцией плотности вероятности , а функцию плотности, которая в действительности соответствует нашему процессу и которую мы оцениваем f(x) – генеральной функцией плотности вероятности.
Смысл этой функции заключён в следующем (см. рис.1.): площадь фигуры, ограниченной графиком функции плотности вероятности f(x), снизу осью абсцисс Ох, слева – прямой x=a, справа прямой x=bравна вероятности P того, что измеряемая величина, значения которой мы получаем в ходе эксперимента, примет значения от a до b:
Функцию F(x) называется генеральной функцией распределения, а кривая, ее оценивающая и получающаяся из выборки, называется эмпирической функцией распределения.
Для построения эмпирической функции распределения нужно вычислить накопленные частотыдля каждого промежутка группированного статистического ряда wx:
Пусть хнекоторое число. Тогда количество вариант mk значения которых меньше х, называется накопленной частотой, т.е.
Для первого промежутка эта частота равна 0, для для второго - относительной частоте попадания в первый промежуток, для третьего– сумме относительных частот попадания в первый и второй промежутки, для четвертый – сумме относительных частот попадания в первый, второй и третий промежутки и т.д.
Кумулянтаесть графическое изображение вариационного ряда, когда на вертикальной оси откладываютсянакопленные частоты или частности, а на горизонтальной - значения признака или середину промежутка.
Отношение накопленной частоты к общему числу наблюдений N называется относительнойнакопленной частотой или накопленной частостью wk / N.
Ломанная, соединяющая точки, первая координата которых – середина промежутка, а вторая равна относительной накопленной частоте и будет эмпирической функцией распределения.
Задача статистического оценивания неизвестных параметров - одна из двух основных (наряду с задачей проверки статистических гипотез) задач математической статистики.
Предположим, что имеется параметрическое семейство распределений вероятностей (для простоты будем рассматривать распределение случайных величин и случай одного параметра). Здесь - числовой параметр, значение которого неизвестно. Требуется оценить его по имеющейся выборке значений, порожденной данным распределением.
Различают два основных типа оценок: точечные оценки и доверительные интервалы.