Группировочным называется признак, по которому проводиться разбиение единиц совокупности на отдельные группы. В основание группировки могут быть положены как количественные, так и атрибутивные признаки. Первые имеют числовое выражение, а вторые отражают состояние единицы совокупности.
После того как определено основание группировки, следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, численности совокупности, степени вариации.
Ориентировочно определить оптимальное количество групп можно по формуле американского ученого Стерджесса:
n = 1 + 3,322 lg N,
где n – число групп; N – число единиц совокупности.
Получаем следующее соотношение:
N
15-24
25-44
45-89
90-179
180-359
360-719
n
Когда определено число групп, следует определить интервалы группировки.
Интервал – это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою границу: верхнюю и нижнюю или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верней границей – наибольшее значение признака в интервале. Величина (длина) интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы бывают:
- открытые, когда имеется только либо верхняя, либо нижняя граница;
- закрытые, когда имеются и нижняя, и верхняя границы.
Интервалы группировки в зависимости от их величины бывают равные и неравные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по формуле:
i = или i = .
Если размах вариации признака совокупности велик и значение признака совокупности варьируются неравномерно, то необходимо использовать группировку с неравными интервалами.
Неравные интервалы могут быть прогрессивно - возрастающими или прогрессивно - убывающими в арифметической или геометрической прогрессии.
Также интервалы могут быть специализированные и произвольные. Специализированными называются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
Интервалы которые будут не прогрессивно – убывающими, не прогрессивно – возрастающими называются произвольными.