1. Первоначально решается вопрос о выборе группировочного признака. Группировочным признакомназывается признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
2. Определение числа групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования, численности совокупности и вида признака, а также от степени вариации признака.
При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака. Пример: при группировке населения по полу можно выделить только две группы: мужчины и женщины.
При группировке по количественному признакуво внимание принимается степень колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. Кроме того, учитывается численность изучаемой совокупности. Зависимость между числом групп и численностью единиц совокупности выражается формулой Стерджесса:
,
где n – число групп;
N – число единиц совокупности.
3. После определения числа групп следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы в зависимости от их величины бывают:
а) равные интервалы устанавливаются, если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер.
Величина равного интервала определяется по следующей формуле:
б) неравные интервалы строятся, если группировочный признак имеет сильную вариацию.
По обозначению границ выделяют интервалы:
а) открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего;
б) закрытыми называются интервалы, у которых обозначены обе границы.
№
Открытые интервалы
Закрытые интервалы
До 300
200 – 300
300 – 400
300 – 400
400 – 500
400 – 500
500 и более
500 – 600
При группировке по количественному признаку границы интервалов могут быть обозначены по – разному:
а) если в основании группировки лежит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i+1-го интервала. Возникает вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. В таких случаях нижнюю границу можно формировать по принципу “включительно”, а верхнюю – по принципу “исключительно”
б) если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.
4. После определения группировочного признака и границ групп строится ряд распределения.