Рассмотрим выборку {х1,х2,...,хп} объема п из генеральной совокупности. этой выборки представляют собой значения случайной величины X.
На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел х1,х2,...,хп по возрастанию.
Различные элементы выборки называются вариантами.
Частотой вариантыназывается число , показывающее, сколько раз эта варианта встречается в выборке.
относительной частотой называется число
Вариационным рядом называется последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются.
Составляется таблица аналогичная ряду распределения. В верхней строке наблюдаемые значения в возрастающем порядке, а в нижней относительные частоты. Такая таблица называется эмпирическим рядом распределения.
Эмпирической функцией распределения или функцией распределения выборки, которую обозначили как Fn(x) называют функцию, определяющую для каждого х относительную частоту события х<х, означающего что значение количественного признака х будет меньше числа х. Другими словами имеет место равенство Fn(x)=nx/n, где n – объем выборки, а nx- число вариант, меньших х.
График эмпирической функции является приближением для теоретической функции, т.е. его можно использовать для оценки законов распределения по выборочным данным.
Для этой же цели используют и другие графики: полигон и гистограмма частот.
Полигон относительных частот – это ломаная линия, отрезки которой соединяют точки. (x1; w1), (x2; w2), w - относительные частоты.
Наглядны, если не много вариантов.
При большом числе вариантов строят гистограмму частот. При построении гистограмм вариант разбивают на подинтервалы, чаще одинаковой длины и для каждого подинтервала находят сумму частот попавших в данный подинтервал.
Гистограммой частот – называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются подинтервалы, высоты прямоугольников=ni/h, где ni – сумма частот, вариант, попавший в i подинтервал, h – длина подинтервала.
Гистограммой относительных частот – называют ступенчатую, состоящую из прямоугольников, основаниями являются подинтервалы с длиною h, а высота = wi/h. гистограммы относительных частот обозначают fn(x) и часто называют эмпирической плотностью распределения. Сумма всех площадей прямоугольников = 1.