Выборочная дисперсия

Для выборки из n наблюдений выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии.

Несмещенная оценка дисперсии определяется по формуле:

Характеристики генеральной совокупности	Формулы оценивания
Среднее, m
Дисперсия,

[ii] Выборочная ковариация

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Выборочная ковариация между x и y определяется как

[iii] Коэффициент корреляции

Коэффициент корреляции является более точной мерой зависимости между величинами. Подобно дисперсии и ковариации коэффициент корреляции имеет две формы – теоретическую и выборочную.

Для двух переменных x и y теоретический коэффициент корреляции определяется следующим образом:

выборочный коэффициент корреляции определяется по формуле:

[iv] Риск портфеля трехфакторной модели s²_p =V_p= X^T*COV*X

[v] Оценка параметров регрессионной модели.

Для оценки параметров регрессионного уравнениянаиболее часто используют метод наименьших квадратов (МНК), согласно которому в качестве оценки принимают вектор a, который минимизирует сумму квадратов отклонения наблюдаемых значений у; от модельных значений , т. е. квадратичную форму:

Þ min.

Формула для вычисления параметров регрессионного уравнения имеет вид:

a = (X^тX )^-1 X ^тY

Рассмотрим случай зависимости переменной Y от одного фактора Х.

Мы хотим подобрать уравнение

для вычисления а₁ можно использовать следующие выражения:

а₁= =

а₀₌

Вычисление параметров рыночной модели m_i= a_i + b_i´m_f

с помощью МНК:

= =

[vi] Дисперсионный анализ модели регрессии.

После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих - и ;

(*)

Величина , — расчетное значение у в наблюдении i— это то значение, которое имел бы у при условии, что уравнение регрессии было правильным, и отсутствии случайного фактора. Это, иными словами, величина у, спрогнозированная по значению х в данном наблюдении. Тогда остаток , есть расхождение между фактическим и спрогнозированным значениями величины y. Это та часть у, которую мы не можем объяснить с помощью уравнения регрессии.

Используя (*) разложим дисперсию у:

(**)

Это означает, что мы можем разложить Var (у) на две части: — часть, которая «объясняется» уравнением регрессии в вышеописанном смысле, и Var(e) — «необъясненную» часть.

используя определение выборочной дисперсии и умножив на n обе части уравнения (**), можно представить его следующим образом:

(***)

где - значения y, вычисленные по модели;

S_e² = =- остаточная сумма квадратов отклонений;

S_y² =- общая сумма квадратов отклонений зависимой переменной от ее среднего значения,

- сумма квадратов отклонений, объясненная регрессией.

[vii] коэффициент детерминации - R².

Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.

В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный R², или _, рассчитывается так:

, где

n — число наблюдений;

k — число независимых переменных.