Существует три типа шкал оценки признаков: номинальная, порядковая и интервальная
1. Номинальная шкала является низшей шкалой измерения. Номинальные шкалы основаны на качественных признаках, различия между которыми не поддаются количественному измерению (количественными считаются такие переменные, различие между которыми выражается в том, насколько отличаются друг от друга объекты, обладающие каким-либо свойством). Состояние номинального признака обычно называется модальностью. Например, признак «окраска кожицы плода» имеет несколько модальностей: белая, кремовая, желтая, зеленая, красная, фиолетовая и т.д.
Исходные данные номинальных признаков состоят из наблюдаемых частот проявления каждой модальности (частотные данные). Единственными математическими связями, уместными по отношению к номинальным шкалам, являются тождество и различие состояний признака. Для характеристики номинальных данных наиболее часто используются пропорция и процентное отношение. Арифметические операции над величинами, измеренными в номинальной шкале, лишены смысла. Единственным показателем средней тенденции является мода (модальность, встречающаяся с наибольшей частотой). Например, в коллекции сортов яблони по форме плодов, наблюдали следующее распределение: цилиндрическая – 13 сортов, округлая – 56 сортов, плоскоокруглая – 121 сорт, коническая – 45 сортов. Модой является модальность «плоскоокруглая».
2. Порядковая (ранговая) шкала.
Порядковые шкалы основаны, как правило, также на качественных признаках. Однако в отличие от номинальных шкал порядковые шкалы соответствуют таким качественным переменным, для которых характерна некоторая упорядоченность, направленность или степень важности. Например, устойчивость к болезням, выражаемая в баллах. В дополнение к тождеству и различию для порядковых шкал используются связи типа больше или меньше. Как и в случае номинальной шкалы, арифметические операции с рангами не сохраняют своего смысла, поэтому желательно ими не пользоваться. Состояние порядкового признака обычно называют рангом. Рангом Ri наблюдения Xi среди величин X1, … Хn называют тот порядковый номер, который получит значение Xi при расстановке чисел X1, … Хn в порядке возрастания или убывания. Поскольку значения X1, … Хn зависят от случая, случайными величинами оказываются и их ранги.
Пример. Исходный вариационный ряд оценок признака у 7 объектов в порядковой шкале (например, степени повреждения штамба плодовых деревьев морозами по 10-ти балльной шкале) – 2, 4, 8, 1, 9, 5, 5.
Ранжированный в порядке возрастания вариационный ряд этих объектов – 1, 2, 4, 5, 5, 8, 9.
Порядковые номера исследованных объектов соответственно – 1, 2, 3, 4, 5, 6, 7
Ранги объектов - 1; 2; 3; 4,5; 4,5; 6; 7
Сумма рангов: 1+2+3+4,5+4,5+6+7=28 (сумма рангов должна быть равна сумме порядковых номеров 1+2+3+4+5+6+7=28).
Переход от самих наблюдений к их рангам сопровождается определенной потерей информации.
Для ранговой шкалы в качестве показателя средней тенденции используют медиану. Медианой называется средняя, относительно которой ранжированный ряд распределения делится на две половины: в обе стороны от медианы располагается одинаковое число членов ряда. Определить медиану довольно легко. Для этого совокупность наблюдений ранжируют по возрастающим (или по убывающим) значениям признака, и если число членов ряда нечетное, то центральная варианта и будет его медианой. При четном числе членов ряда медиана определяется по полусумме двух соседних вариант, расположенных в центре ряда. Медиана имеет, по крайней мере, два преимущества перед средним арифметическим: 1) она всегда существует в виде точки, разделяющей распределение совокупности пополам (объекты со средним выражением признака могут и не существовать); 2) она весьма устойчива к небольшим возмущениям исходного распределения (если имеются выбросы или грубые ошибки их влияние на медиану будет невелико).
Пример. Имеется ранжированный вариационный ряд, содержащий 7 дат – 1, 2, 4, 5, 5, 8, 9. Медианой этого ряда будет центральная варианта под порядковым номером 4, то есть 5.
Для ряда, содержащего 10 дат - 6; 8; 10; 12; 14, 16; 18; 20; 22; 24 – медианой будет полусумма двух его центральных членов, то есть, дат с порядковыми номерами 5 и 6 - (14+16)/2=15.
Для многомерных наблюдений Xi, описанный выше план не действует. В многомерном пространстве не существует линейного упорядочения. Поэтому в многомерном случае переход к рангам невозможен. Не существует пока и теории многомерного непараметрического анализа.
3. Интервальная шкала. Относится к количественным признакам. Шкала, в которой можно отразить, насколько по степени выраженности заданного свойства один из объектов отличается от другого, называется интервальной. Для того чтобы задать интервальную шкалу надо определить начальную точку и единицу измерения. Далее при измерении ставят в соответствие каждому объекту число, показывающее, на сколько единиц измерения этот объект отличается от объекта, принятого за начальную точку (например, температура, в градусах Цельсия или масса в г и т.п.). Количественные шкалы допускают арифметические преобразования.