русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Коэффициенты корреляции рангов


Дата добавления: 2013-12-23; просмотров: 2048; Нарушение авторских прав


Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся коэффициенты Спирмэна (ρ) и Кендэла (τ), основанные на корреляции не самих значений коррелируемых признаков, а их рангов – порядковых номеров, присваиваемых каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать (нумеровать) в одном и том же порядке: от меньших значений к большим и наоборот. Если встречается несколько значений х (или у), то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений. Ранги признаков х и у обозначают символами Rx и Ry (иногда Nx и Ny). Суждение о связи между изменениями значений х и у основано на сравнении поведения рангов по двум признакам параллельно. Если у каждой пары х и у ранги совпадают, это характеризует максимально тесную связь. Если же наблюдается полная противоположность рангов, т.е. в одном ряду ранги возрастают от 1 до n, а в другом – убывают от n до 1, это максимально возможная обратная связь. Подходы для оценки тесноты связи у Спирмэна и Кендэла несколько различаются. Для расчета коэффициента Спирмэна значения признаков х и у нумеруют (отдельно) в порядке возрастания от 1 до n, т.е. им присваивают определенный ранг (Rx и Ry) – порядковый номер в ранжированном ряду. Затем для каждой пары рангов находят их разность (обозначается как d= RxRy), и квадраты этой разности суммируют.

,

где d – разность рангов х и у;

n – число наблюдаемых пар значений х и у.

Коэффициент ρ может принимать значения от 0 до ±1. Следует иметь в виду, что, поскольку коэффициент Спирмэна учитывает разность только рангов, а не самих значений х и у, он менее точен по сравнению с линейным коэффициентом. Поэтому его крайние значения (1 или 0) нельзя безоговорочно расцени­вать как свидетельство функциональной связи или полного отсутствия зависимости между х и у. Во всех других случаях, т.е. когда ρ не принимает крайних значений, он довольно близок к r.



Формула Ошибка! Источник ссылки не найден. применима строго теоретически только тогда, когда отдельные значения х у), а следовательно, и их ранги не повторяются. Для случая повторяющихся (связанных) рангов есть другая, более сложная формула, скорректированная на число повторяющихся рангов. Однако опыт показывает, что результаты расчетов по скорректированной формуле для связанных рангов мало отличаются от результатов, полученных по формуле для не­повторяющихся рангов. Поэтому на практике формула Ошибка! Источник ссылки не найден. успешно применяется как для неповторяющихся, так и для повто­ряющихся рангов.

Коэффициент корреляции рангов Кендэла τ строится несколь­ко по-другому, хотя его расчет также начинается с ранжирования значений признаков х и у. Ранги х (Rx) располагают строго в порядке возрастания и па­раллельно записывают соответствующее каждому Rx значение Ry. Поскольку Rx записаны строго по возрастанию, то ставится задача определить меру соответствия последовательности Ry «правильному» следованию Rx. При этом для каждого Ry последо­вательно определяют число следующих за ним рангов, превыша­ющих его значение, и число рангов, меньших по значению. Первые («правильное» следование) учитываются как баллы со знаком «+», и их сумма обозначается буквой Р. Вторые («неправильное» следование) учитываются как баллы со знаком «–», и их сумма обозначается буквой Q. Очевидно, что максимальное значение Р достигается в том случае, если ранги y (Ry) совпадают с рангами х (Rx) и в каждом ряду представляют ряд натуральных чисел от 1 до п. Тогда после первой пары значений Rx = 1 и Ry = 1 число превышения данных значений рангов составит (n – 1), после второй пары, где Rx = 2 и Ry = 2, соответственно (п – 2) и т.д. Таким образом, если ранги х и у совпадают и число пар рангов равно n, то

.

Если же последовательность рангов х и у имеет обратную тенденцию по отношению к последовательности рангов х, то Q будет такое же максимальное значение по модулю:

.

Если же ранги у не совпадают с рангами х, то суммируются все положительные и отрицательные баллы (S=P+Q); отношение этой суммы S к максимальному значению одного из слагаемых и представляет собой коэффициент корреляции рангов Кендэла τ, т.е.:

.

Формула коэффициента корреляции рангов Кендэла Ошибка! Источник ссылки не найден. применяется для случаев, когда отдельные значения признака (как х, так и у) не повторяются и, следовательно, их ранги не объе­динены. Если же встречается несколько одинаковых значений х (или у), т.е. ранги повторяются, становятся связанными, коэффици­ент корреляции рангов Кендэла определяется по формуле:

,

где S – фактическая общая сумма баллов при оценке +1 каж­дой пары рангов с одинаковым порядком изменения и –1 каждой пары рангов с обратным порядком изме­нения;

– число баллов, корректирующих (уменьшающих) максимальную сумму баллов за счет повторений (объединений) t рангов в каждом ряду.

Отметим, что случаи следования одинаковых повторяющихся рангов (в любом ряду) оцениваются баллом 0, т.е. они не учиты­ваются при расчете ни со знаком «+», ни со знаком «–».

Преимущества ранговых коэффициентов корреля­ции Спирмэна и Кендэла: они легко вычисляются, с их помощью можно изучать и измерять связь не только между количественны­ми, но и между качественными (описательными) признаками, ранжированными определенным образом. Кроме того, при ис­пользовании ранговых коэффициентов корреляции не требуется знать форму связи изучаемых явлений.

Если число ранжируемых признаков (факторов) больше двух, то для измерения тесноты связи между ними можно использовать предложенный М. Кендэлом и Б. Смитом коэффициент конкордации (множественный коэффициент ранговой корреляции):

,

где S — сумма квадратов отклонений суммы т рангов от их средней величины;

т — число ранжируемых признаков;

п — число ранжируемых единиц (число наблюдений).

Формула Ошибка! Источник ссылки не найден. применяется для случая, кода ранги по каж­дому признаку не повторяются. Если же есть связанные ран­ги, то коэффициент конкордации рассчитывается с учетом числа таких повторяющихся (связанных) рангов по каждому фактору:

,

где t – число одинаковых рангов по каждому признаку.

Коэффициент конкордации W может принимать значения от 0 до 1. Однако, необходимо проверить его на существенность (значимость) с помощью критерия χ2 при отсутствии связанных рангов по формуле (9), а при их наличии – по формуле Ошибка! Источник ссылки не найден.:

, (9) .

Фактическое значение χ2 сравнивается с табличным, соответ­ствующим принятому уровню значимости α (0,05 или 0,01) и числу степеней свободы v = п – 1. Если χ2факт > χ2табл, то W – существенен (значим).

Коэффициент конкордации особенно часто используется в экспертных оценках, например, для того, чтобы определить сте­пень согласованности мнений экспертов о важности того или иного оцениваемого показателя или составить рейтинг отдельных единиц по какому-либо признаку. В формуле Ошибка! Источник ссылки не найден. в этих случаях т означает число экспертов, а n — число ранжируемых единиц (или признаков).



<== предыдущая лекция | следующая лекция ==>
Методы выявления и оценки корреляционной связи | Особенности коррелирования рядов динамики


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.004 сек.