Для выборки из n наблюдений выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:
.
Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии.
Несмещенная оценка дисперсии определяется по формуле:
.
Характеристики генеральной совокупности
Формулы оценивания
Среднее, m
Дисперсия,
[ii] Выборочная ковариация
Выборочная ковариация является мерой взаимосвязи между двумя переменными.
Выборочная ковариация между x и y определяется как
[iii] Коэффициент корреляции
Коэффициент корреляции является более точной мерой зависимости между величинами. Подобно дисперсии и ковариации коэффициент корреляции имеет две формы – теоретическую и выборочную.
Для двух переменных x и y теоретический коэффициент корреляции определяется следующим образом:
.
выборочный коэффициент корреляции определяется по формуле:
Для оценки параметров регрессионного уравнениянаиболее часто используют метод наименьших квадратов (МНК), согласно которому в качестве оценки принимают вектор a, который минимизирует сумму квадратов отклонения наблюдаемых значений у; от модельных значений , т. е. квадратичную форму:
Þ min.
Формула для вычисления параметров регрессионного уравнения имеет вид:
a = (Xт X )-1 X т Y
Рассмотрим случай зависимости переменной Y от одного фактора Х.
Мы хотим подобрать уравнение
.
для вычисления а1 можно использовать следующие выражения:
а1= =
а0=
Вычисление параметров рыночной модели mi = ai + bi ´mf
с помощью МНК:
= =
[vi] Дисперсионный анализ модели регрессии.
После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих - и ;
(*)
Величина , — расчетное значение у в наблюдении i— это то значение, которое имел бы у при условии, что уравнение регрессии было правильным, и отсутствии случайного фактора. Это, иными словами, величина у, спрогнозированная по значению х в данном наблюдении. Тогда остаток , есть расхождение между фактическим и спрогнозированным значениями величины y. Это та часть у, которую мы не можем объяснить с помощью уравнения регрессии.
Используя (*) разложим дисперсию у:
(**)
Это означает, что мы можем разложить Var (у) на две части: — часть, которая «объясняется» уравнением регрессии в вышеописанном смысле, и Var(e) — «необъясненную» часть.
используя определение выборочной дисперсии и умножив на n обе части уравнения (**), можно представить его следующим образом:
(***)
где - значения y, вычисленные по модели;
Se2 = =- остаточная сумма квадратов отклонений;
Sy2 =- общая сумма квадратов отклонений зависимой переменной от ее среднего значения,
Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный R2, или , рассчитывается так: