Если совокупность разбита на группы по какому-либо факторному признаку x и по каждой группе рассчитаны групповые средние и дисперсии результативного признака , то можно определить три показателя вариации: общую дисперсию, межгрупповую дисперсию и среднюю из внутригрупповых дисперсий.
Общая дисперсия характеризует вариацию признака, которая зависит от всех условий данной совокупности:
где - общая средняя изучаемого показателя.
Межгрупповая дисперсия отражает вариацию изучаемого показателя, которая возникает под влиянием факторного признака, положенного в основу группировки. Она характеризует вариацию групповых (частных) средних около общей средней:
где – средняя в i-й группе.
Средняя из внутригрупповых дисперсий характеризует случайную вариацию в каждой отдельной группе.
где - число единиц в каждой группе.
Данные три дисперсии образуют систему:
На основе правила сложения дисперсий рассчитывают эмпирические показатели тесноты зависимости вариации результативного показателя от вариации факторного признака .
Отношение межгрупповой дисперсии к общей называется эмпирическим коэффициентом детерминации:
Корень квадратный из него – эмпирическое корреляционное отношение:
Данный показатель меняется от 0 до 1. Чем он ближе к 1, тем теснее взаимосвязь между изучаемыми показателями.
Пример.По данным таблицы 6.5 определитьобщую дисперсию розничного товарооборота, коэффициент детерминации и эмпирическое корреляционное отношение.
Таблица 6.5
Торговая площадь, м2,
Количество магазинов,
ni
Средний объем розничного товарооборота, млн.руб.,
Среднее квадратическое отклонение розничного товарооборота,
млн. руб.,
100-200
10,1
0,2
200-300
12,6
0,4
300-400
25,3
0,9
400-500
32,5
0,3
Решение. Сначала вычислим средний объем розничного товарооборота для всей совокупности:
Находим среднюю из внутригрупповых дисперсий:
Определяем межгрупповую дисперсию:
Общая дисперсия розничного товарооборота:
Коэффициент детерминации:
Эмпирическое корреляционное отношение:
что означает очень сильную зависимость вариации розничного товарооборота от торговой площади.
Если в совокупности исследуется доля единиц, обладающих тем или иным альтернативным признаком, дисперсия этой доли определяется по формуле:
где p – доля единиц, обладающих данным признаком;
q – доля единиц, не обладающих данным признаком.
Причём:
p + q = 1.
Пример.По данным таблицы 6.6 определить долю рабочих старше 50 лет в целом по пяти предприятиям и общую дисперсию долю.