Коэффициент корреляции Пирсона называется также коэффициентом линейной корреляции или произведением моментов Пирсона. Он позволяет определить силу связи между двумя признаками, измеренными в метрических шкалах.
Его формула выглядит следующим образом:
У разных авторов эта формула может выглядеть по-разному. В данном пособии формула приводится в том виде, как она дана в кн. Наследов А.Д., Тарасов С.Г. «Применение математических методов в психологии».
Последовательность расчетов можно продемонстрировать на следующем примере. Итак, необходимо:
1. Вычислить значение корреляции между показателями роста в сантиметрах и веса в килограммах у представителей группы студентов.
2. Поставить вопрос о достоверности этого коэффициента. Для решения второй задачи необходимо предварительно сформулировать нулевую и альтернативную гипотезы: Н0: корреляция между показателями роста и веса значимо не отличается от нуля (является случайной). Н1: корреляция между показателями роста и веса значимо отличается от нуля (является неслучайной).
3. Данные заносятся в таблицу, при этом желательно, чтобы один из столбцов значений признака (показатели роста или веса) был упорядочен.
№
X (рост)
Y (вес)
xi-Мх
(xi-Мх)2
yi-Му
(yi-Му)2
(xi-Mx)*(yi-My)
-7,6
57,76
-11,3
127,69
85,88
-6,6
43,56
-9,3
86,49
61,38
5,4
29,16
6,7
44,89
36,18
-6,6
43,56
-1,3
1,69
8,58
10,4
108,16
12,7
161,29
132,08
-3,6
12,96
-8,3
68,89
29,88
-2,6
6,76
0,7
0,49
-1,82
-0,6
0,36
9,7
94,09
-5,82
8,4
70,56
4,7
22,09
39,48
3,4
11,56
-4,3
18,49
-14,62
n=10
Мх=166,6
Мy=58,3
Σ(xi-Mx)2=384,4
Σ(yi-My)2=626,1
Σ(xi-Mx)*(yi-My)=371,2
σх =≈ 6,53 σу =≈ 8,34
Rxy = ≈ 0,758
Некоторые исследователи, вычислив значение коэффициента корреляции, на этом и останавливаются. Но с точки зрения грамотной методологии эксперимента следует определить и уровень значимости (то есть степень достоверности) данного коэффициента.
Уровень значимости коэффициента корреляции вычисляется при помощи таблицы критических значений. Ниже дан фрагмент указанной таблицы, позволяющий определить уровень значимости полученного нами коэффициента.
n
p = 0,1
p = 0,05
p = 0,01
p = 0,001
0,582
0,666
0,798
0,898
0,549
0,632
0,765
0,872
0,521
0,602
0,735
0,847
Мы выбираем ту строку, которая соответствует объему выборки. В нашем случае n = 10. Мы выбирает в данной строке то табличное значение, которое чуть меньше эмпирического (или точно равно ему, что бывает крайне редко). Это выделенное жирным шрифтом число 0,632. Оно относится к столбцу со значением уровня достоверности p = 0,05. То есть, фактически, эмпирическое значение занимает промежуточное положение между столбцами p = 0,05 и p = 0,01, следовательно, 0,05 ³ p ³ 0,01. Таким образом, мы отвергаем нулевую гипотезу и приходим к выводу, что полученный результат (Rxy = 0,758) значим на уровне p < 0,05 (это уровень статистической значимости): Rэмп > Rкр (p < 0,05) H0, Þ Н1! ст. зн.
На бытовом языке это можно проинтерпретировать следующим образом: можно ожидать, что эта сила связи будет иметь место в выборке реже, чем в пяти случаях из 100, если эта связь – следствие случайности.