В отличие от древовидной классификации, метод к-средних разбивает всю выборку по заданным признакам на указанное количество кластеров. Таким образом, чтобы использовать этот метод нужно знать или предполагать сколько кластеров мы хотим иметь.
Итак, мы задаём количество кластеров 4 и первым делом смотрим, действительно ли все переменные (шкалы теста) отличаются во всех 4-х кластерах. Эта проверка осуществляется с помощью дисперсионного анализа (F-критерий), результаты которого отражены в следующей таблице.
F р
FPI Невротичность 11,32104 0,000015
FPI Спонтанная агрессивность 17,29933 0,000000
FPI Депрессивность 12,44079 0,000006
FPI Раздражительность 21,78287 0,000000
FPI Общительность 10,04764 0,000043
FPI Уравновешенность 12,79335 0,000005
FPI Реактивная агрессивность 30,89699 0,000000
FPI Застенчивость 16,97276 0,000000
FPI Открытость 10,14094 0,000040
FPI Экстраверс-интроверс 7,21617 0,000536
FPI Эмо. Лабильность 6,40723 0,001163
FPI Маскулинность-феминность 23,27450 0,000000
Уровень значимости для всех шкал теста очень высокий, все значения F-критерия значимы. Таким образом, все шкалы теста являются критериями классификации.
Далее нам необходимо узнать каковы средние арифметические шкал теста для каждого кластера. Это отображено в следующей таблице.
Кластер 1 Кластер 2 Кластер 3 Кластер 4
FPI Невротичность 7,25 4,50 7,00 4,36
FPI Спонтанная агрессивность 7,25 5,50 8,29 3,64
FPI Депрессивность 6,67 4,38 7,57 5,64
FPI Раздражительность 7,08 6,13 8,50 4,45
FPI Общительность 3,67 7,50 4,64 5,64
FPI Уравновешенность 2,75 4,00 5,93 5,45
FPI Реактивная агрессивность 6,75 6,75 8,21 3,82
FPI Застенчивость 6,50 3,00 6,71 5,91
FPI Открытость 5,17 6,63 8,07 4,36
FPI Экстраверс-интроверс 4,17 6,00 6,86 4,91
FPI Эмо. Лабильность 6,67 5,13 6,93 5,55
FPI Маскулинность-феминость 3,08 7,00 6,64 3,82
Для наглядности, отобразим средние арифметические на графике.
Последний и самый важный этап кластерного анализа – узнать кто же конкретно входит в кждый из четырех кластеров, а затем описать их характеристики, основываясь на графике или таблице со средними значениями. После этого блюдо можно подавать на стол под названием «Новая классификация».
Вывод
Кластерный анализ – красивый метод. Но всегда нужно помнить о его недостатках:
1. Как и факторный анализ, он может давать неустойчивые кластеры. Повторите исследование на других людях и сравните результаты классификации. Скорее всего, они будут отличаться. На сколько – вопрос качества самого исследования.
2. Он реализует индуктивный метод исследования от частного к общему, что чревато антинаучными выводами. В идеале выборка для классификации должна быть очень большая, неоднородная, желательно подобранная методом стратификации или рандомизации. Наука движется по пути проверки гипотез, поэтому не нужно злоупотреблять кластерным анализом. Лучше всего использовать его для проверки гипотезы о наличии каких-либо типов, а не создавать классификацию на голом месте.
3. Как и любой метод многомерного шкалирования, кластерный анализ имеет множество особенностей, связанных с внутренними методами. Каков критерий объединения людей в кластеры, метод поиска различий, количество шагов до завершения алгоритма в методе к-средних и т.д. поэтому результаты могут меняться, хоть и несущественно, в зависимости от «настроек» процедуры.