Потребность в специальном инструментарии для анализа связей ранговых признаков обусловлена их спецификой, основными моментами которой являются:
· искажения, привносимые рангами в интуитивные представления о степенях различия между рангами,
· общность величин дисперсий ранговых признаков.
Использование последнего момента позволило построить по аналогии с коэффициентом корреляции для номинальных признаков коэффициенты корреляции для ранговых признаков. Известны коэффициенты ранговой корреляции Спирмена - и Кендэла - .
Рассмотрим коэффициент корреляции для номинальных признаков .
Введем в рассмотрение центрированные величины
Тогда среднеквадратичные отклонения будут удовлетворять соотношениям
Для центрированных номинальных признаков коэффициент корреляции примет вид
.
Ранговая корреляция Кендэла
Рассмотрим ситуацию, когда два эксперта упорядочили по своему предпочтению объектов.
Пусть – результат экспертизы первого эксперта,
– результат экспертизы второго эксперта,
здесь и – ранги (номера предпочтения от единицы до ).
Рассмотрим сочетания пар , построенных нижеследующим образом:
Количество таким образом построенных пар равно половине количества элементов прямоугольной матрицы: .
Введем различие между объектами
Аналогичные действия проделаем с последовательностью , причем порядок перебора пар должен повторять порядок перебора пар .
Например:
2 4
1 5
2 5
1 3
2 1
-1
1 4
-1
2 3
1 2
4 5
5 3
-1
-1
4 1
-1
5 4
-1
4 3
-1
5 2
-1
5 1
-1
3 4
-1
5 3
-1
3 2
-1
1 3
4 2
-1
-1
Сумма
2
– коэффициент ранговой корреляции Кендэла.
В примере
.
Ранговая корреляция Спирмена-
Рассмотрим другую меру различия между объектами.
Пусть
Так как ранги – числа последовательности натурального ряда, то
Доказательство:
с другой стороны это
что и требовалось.
значит
аналогично .
Пусть ,
Тогда
.
- коэффициент ранговой корреляции Спирмена.
Вспомним предыдущий пример: ,
-1
-3
.
В данном примере коэффициенты ранговой корреляции Спирмена и Кендэла совпали. Но обычно этого нет.
C:/OlesDoc/AnalMnSv
П.2.2. Анализ множественных связей
результирующий признак.
предикторные переменные (совокупность других, кроме результирующего признака, переменных).
Если, зафиксировать «значение» , то из всех возможных способов определения прогнозного (аппроксимирующего) значения для неизвестного значения наилучшим (в смысле минимума среднего квадрата ошибки прогноза), как оказалось, является условное среднее значение анализируемого результирующего показателя , т.е. величина , где усреднение производится при условии, что объясняющие переменные зафиксированы на уровне .