Наиболее мощным непараметрическим критерием для оценки различий между центральными параметрами (средними, медианами и т.п.) двух выборок является U-критерий Манна-Уитни.
Порядок вычисления этого критерия следующий:
1. Объединение двух групп наблюдений и ранжирование единой выборки. Но, в то же время, для каждого ранга необходимо помнить принадлежность к исходной группе.
2. Разделение единой выборки на две исходные группы, но уже в ранговой шкале.
3. Определение сумм рангов по каждой выборке.
4. Определение критерия для каждой группы по формулам
; ,
где n1 – объем первой выборки; n2 – объем второй выборки; ∑Ri(1) – сумма рангов первой выборки; ∑Ri(2) – сумма рангов второй выборки
Несложно показать, что U1=n1n2 – U2
5. Если найденные значения критерия (U1, U2) входят в интервал для пороговых значений UТ, то выборки не различаются по центральным параметрам.
Этот критерий можно использовать и для сравнения выборок, имеющих разный объем.
Пример. Необходимо сравнить две группы сеянцев вишни по устойчивости к коккомикозу. В таблице представлена сумма баллов поражения за 5 учетов в течение всей вегетации.
Группа 1
Группа 2
n1= 9
n2= 10
Объединяем обе группы наблюдений и ранжируем в возрастающем порядке:
Суммарный балл
Ранг
Группа
Суммарный балл
Ранг
Группа
3,5
3,5
Сумма
Разделяем группы и определяем суммы рангов (жирный шрифт):
Группа 1
Группа 2
3,5
3,5
U1= 9·10+9·(9+1)/2 - 118=135 - 118=17
U2= 9·10+10·(10+1)/2 - 72=145 – 72=73
Проверка U1=n1n2-U2=90-73=17
Находим интервал пороговых значений UТ.. Для этого воспользуемся табл. А. Для случая n1=9, n2=10 находим, что 20<UТ<70. Следовательно, требуемое для отклонения H0значение U должно быть меньше или равно 20 и больше 70. Поскольку расчетные U1 и U2 равны соответственно 17 и 73 H0 отклоняется. Значит, эти две группы сеянцев значимо (с вероятностью 95%) различаются по степени поражения коккомикозом.
Однофакторный анализ рангов по Уилкоксону, критерий множественных сравнений.
Этот критерий подобен критерию Манна-Уитни, но допускает число сравниваемых групп от 3 до 10. При этом предполагается, что комплекс равномерный, то есть количество наблюдений (n) во всех группах должно быть одинаково.
Таблица А
Критические значения UТ и UТ’ для двустороннего критерия при уровне значимости α = 0,05. При заданных значениях n1 и n2 для значимости различия необходимо, чтобы меньшее из расчетных U было меньше верхнего значения, приведенного в ячейке таблице или равно ему; а большее из расчетных U - больше нижнего (подчеркнутого) табличного значения или равно ему (Рунион, 1982).
\ n2
n1\
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
0 16
0 18
0 20
0 22
1 23
1 25
1 27
1 29
1 31
2 32
2 34
2 36
2 38
--
--
---
--
0 15
1 17
1 20
2 22
2 25
3 27
3 30
4 32
4 35
5 37
5 40
6 42
6 45
7 47
7 50
8 52
--
--
---
0 16
1 19
2 22
3 25
4 28
4 32
5 35
6 38
7 41
8 44
9 47
10 50
11 53
11 57
12 60
13 63
13 67
--
--
0 15
1 19
2 23
3 27
5 30
6 34
7 38
8 42
9 46
11 49
12 53
13 57
14 61
15 65
17 68
18 72
19 76
20 80
--
--
1 17
2 22
3 27
5 31
6 36
8 40
10 44
11 49
13 53
14 58
16 62
17 67
19 71
21 75
22 80
24 84
25 89
27 93
--
--
1 20
3 25
5 30
6 36
8 41
10 46
12 51
14 56
16 61
18 66
20 71
22 76
24 81
26 86
28 91
30 96
32 101
34 106
--
0 16
2 22
4 28
6 34
8 40
10 46
13 51
15 57
17 63
19 69
22 74
24 80
26 86
29 91
31 97
34 102
36 108
38 111
41 119
--
0 18
2 25
4 32
7 38
10 44
12 51
15 57
17 64
20 70
23 76
26 82
28 89
31 95
34 101
37 107
39 114
42 120
45 126
48 132
--
0 20
3 27
5 35
8 42
11 49
14 56
17 63
20 70
23 77
26 84
29 91
33 97
36 104
39 111
42 118
45 125
48 132
52 138
55 145
--
0 22
3 30
6 38
9 46
13 53
16 61
19 69
23 76
26 84
30 91
33 99
37 106
40 114
44 121
47 129
51 136
55 143
58, 151
62 158
--
1 23
4 32
7 41
11 49
14 58
18 66
22 74
26 82
29 91
33 99
37 107
41 115
45 123
49 131
53 139
57 147
61 155
65 163
69 171
--
1 25
4 35
8 44
12 53
16 62
20 71
24 80
28 89
33 97
37 106
41 115
45 124
50 132
54 141
59 149
63 158
67 167
72 175
76 184
--
1 27
5 37
9 47
13 51
17 67
22 76
26 86
31 95
36 104
40 114
45 123
50 132
55 141
59 151
64 160
67 171
74 178
78 188
83 197
--
1 29
5 40
10 50
14 61
19 71
24 81
29 91
34 101
39 111
44 121
49 131
54 141
59 151
64 161
70 170
75 180
80 190
85 200
90 210
--
1 31
6 42
11 53
15 65
21 75
26 86
31 97
37 107
42 118
47 129
53 139
59 149
64 160
70 170
75 181
81 191
86 202
92 212
98 222
--
2 32
6 45
11 57
17 68
22 80
28 91
34 102
39 114
45 125
51 136
57 147
63 158
67 171
75 180
81 191
87 202
93 213
99 224
105 235
--
2 36
7 47
12 60
18 72
24 84
30 96
36 108
42 120
48 132
55 143
61 155
67 167
74 178
80 190
86 202
93 213
99 225
106 236
112 248
--
2 38
7 50
13 63
19 76
25 89
32 101
38 114
45 126
52 138
58 151
65 163
72 175
78 188
85 200
92 212
99 224
106 236
113 248
119 261
--
2 38
8 52
13 67
20 80
27 93
34 106
41 119
48 132
55 145
62 158
69 171
76 184
83 197
90 210
98 222
105 235
112 248
119 261
127 273
(Прочерки в таблице указывают на невозможность принятия решения при
установленном уровне значимости)
Алгоритм вычисления этого критерия: 1) объединение всех выборок в одну, 2) их ранжирование в возрастающем порядке, 3) разделение по градациям фактора (например, по генотипам или условиям испытания), 4) определение суммы рангов для каждой градации, 5) построение матрицы разностей сумм рангов для пар сравниваемых групп, 6) определение критической разности сумм и сравнение с ней парных разностей.
Рассмотрим пример. Необходимо сравнить четыре гибридные семьи алычи по экспертным оценкам (в баллах) хозяйственной ценности. В таблице представлена сумма оценок (баллов) по 11 наблюдениям для четырех сравниваемых семей.
I
II
III
VI
Объединяем оценки всех четырех групп, располагаем их в возрастающем порядке и ранжируем (таблица)
От-метка
Ранг
Семья
От-метка
Ранг
Семья
От-метка
Ранг
Семья
III
II
II
III
IV
I
III
II
33,5
I
III
I
33,5
I
III
IV
35,5
IV
III
III
35,5
IV
III
II
III
I
I
IV
I
IV
IV
IV
II
IV
II
I
II
III
IV
I
13,5
I
II
II
13,5
I
II
IV
II
IV
Перегруппируем данные в зависимости от принадлежности к исходным семьям и просуммируем ранги.
I
13,5
13,5
33,5
33,5
II
III
VI
35,5
35,5
Проверка правильности расчетов:
R1+R2+R3+R4 = kn/2(1+kn)
R1,R2,R3,R4 – суммы рангов по группам (семьям)
k – число групп (семей)
n – количество наблюдений в каждой группе
253+279+108+350 = 990
Проверка: 4·11/2(1+4·11)=22·45=990
Формируем матрицу разностей сумм рангов:
IV
II
I
III
IV
II
I
III
Для определения критического значения разности сумм обращаемся к табл. Б. Если какая-нибудь из наблюдаемых разностей превышает критическое значение или равна ему, то Н0 отклоняется.
В нашем примере критическое значение разности сумм рангов при числе наблюдений n=11, числе групп k=4 и уровне значимости α=0,05 равно 155. Вывод: с вероятностью 95% гибридная семья III отличается по комплексу хозяйственно ценных признаков от семьи IV и от семьи II. Эти разности сумм рангов отмечены жирным шрифтом в предыдущей матрице разностей. Все остальные различия недостоверны.