На практике установлены следующие соотношения между численностью группируемых значений n переменной x и числом интервалов k:
n
k
40-60
6-8
60-100
7-10
100-200
9-12
200-500
12-17
Число интервалов можно вычислять по формуле , причем, 5≤k≤20. Для предварительного определения числа интервалов k может быть также использована эмпирическая формула с округлением числа до ближайшего целого.
Ширина интервала d сохраняется одинаковой для всех интервалов и определяется как d=(xmax-xmin)/k, где xmaxи xmin – соответственно максимальное и минимальное значение членов ряда.
Ширина интервала d имеет ту же размерность, что и переменная x.
В качестве частоты, соответствующей m-му интервалу величины х, принимают сумму частот Nm членов ряда, попавших в этот интервал.
Отношение Nm к общей численности значений переменных (объему выборки) n , т.е. Nm/ n, называется относительной частотой pm.
Отношение Nm/d является плотностью частоты.
Отношение рm/d – плотностью относительной частоты.
Частота Nm - целое число (измеряется в штуках), pm= Nm/ n измеряется в долях единицы, а Nm/d и рm/d имеют размерность обратную, размерности основной переменной х.
Пример Пусть выборка содержит 10 значений влажности карамели с фруктовой начинкой (в %): 6,8; 6,4; 8,0; 7,6; 6,4; 6,2; 5,8; 6,8; 6,4; 5,6. Интервал, для которого нужно найти перечисленные характеристики, задан границами 6,0 и 7,5, так, что d=(7,5-6,0)/5=0,5. Частота значения 6,2 равна 1, так как в выборке встречается 1 раз, для значения 6,4 частота равна 3, для 6,8-2 и т.д. В заданный интервал попадают значения 6,4 и 6,2% с частотами 3 и 1 соответственно. Таким образом, частота соответствующая заданному интервалу, равна 4, относительная частота равна 4/10, плотность частоты – 4/0,5 и плотность относительной частоты – 0,4/0,5.
При анализе рядов распределения рассматривают взаимосвязь двух переменных: значений членов ряда и соответствующих им частот или относительных частот.
Статистические распределения изображаются графически в виде гистограмм или полигонов частот.
Построение полигона ведется следующим образом.
Серединой каждого интервала является (хm-1-xm)/0,5 - где хm-1 и xm - границы интервала, а m изменяется от 1 до k. Середины интервалов откладывают на оси ординат. На оси абсцисс откладывают Nm или pm
Построение гистограмм осуществляется в следующем порядке. На горизонтальной оси размечают границы интервалов и над каждым интервалом строят прямоугольник с основанием, равным ширине интервала и высотой соответствующей плотности частоты (гистограмма частот) или плотности относительной частоты (гистограмма относительных частот).
Площадь гистограммы равна сумме всех частот, т.е. объему выборки, а площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Расчет частот и относительных частот для примера
Нижняя граница интервала 5,1
6,8; 6,4; 8,0; 7,6; 6,4; 6,2; 5,8; 6,8; 6,4; 5,6
Таблица 2.5
m
хm-1-xm
Середина интервала
(хm-1+xm)∙0,5=xm*
Nm
pm
Nm/d
рm/d
5,1-5,6
5,35
1/10
1/0,5(хm-1-xm =0,5)
1/5 (1/10*1/0,5)
5,6-6,1
5,85
1/10
1/0,5
1/5
6,1-6,6
6,35
4/10
4/0,5
4/5
6,6-7,1
6,85
2/10
2/0,5
2/5
7,1-7,6
7,35
1/10
1/0,5
1/5
7,6-8,1
7,85
1/10
1/0,5
1/5
Сумма
-
-
10(кол-во данных)
-
Рисунок 2.3 - Гистограмма
Рисунок 2.4 – Полигон частот
Для построения полигона частот пользуются столбцами 3 и 4 или 3 и 5.