Регрессионный анализ используется для изучения взаимосвязи между двумя величинами, измеренными в интервальной шкале. Этот вид анализа предусматривает построение регрессионного уравнения, позволяющего количественно описать зависимость одного признака от другого (коэффициент корреляции Пирсона указывает на наличие или отсутствие связи, но эту связь не описывает). Зная случайную величину одного из признаков и используя данное уравнение, исследователь может с определенной степенью вероятности предсказать соответствующее значение второго признака. Линейная зависимость признаков описывается уравнением следующего типа:
у = а + by* x ,
где а - свободный член уравнения, равный подъему графика в точке х=0 относительно оси абсцисс, b – угловой коэффициент наклона линии регрессии равный тангенсу угла наклона графика к оси абсцисс (при условии, что масштаб значений на обеих осях одинаков).
Зная значения исследуемых признаков, можно определить величину свободного члена и коэффициента регрессии по следующим формулам:
а = My – by* Mx
В нашем случае: ;
а = 58,3 – 0,97 * 166,6 = -103,3
Таким образом, формула зависимости веса от роста выглядит следующим образом: у = 0,969 * х – 103,3
Соответствующий график приведен ниже.
Если необходимо описать зависимость роста от веса (х от у), то значения а и b становятся другими и формулы необходимо соответствующим образом модифицировать:
x = а + bx* у
а = Mx – bx* My
Изменяется в таком случае и вид графика. Это задание студентам будет предложено выполнить самостоятельно.
Коэффициент регрессии находится в тесной связи с коэффициентом корреляции. Последний представляет собой среднее геометрическое из коэффициентов регрессии признаков:
Квадрат коэффициента корреляции называется коэффициентом детерминации. Его величина определяет процентное взаимное влияние переменных. В нашем случае R2 = 0,762 = 0,58. Это значит, что 58 % общей дисперсии Y объясняется влиянием переменной X, остальные 42 % обусловлены влиянием неучтенных в уравнении факторов.