Особенность процедур классификации объектов связана с тем, что получаемые решения не являются однозначными. Поэтому исследователь должен определить, насколько получившийся вариант разбиения является корректным. Существует пять методов проверки достоверности (обоснованности) решений кластерного анализа: 1) кофенетическая корреляция, 2) тесты значимости для признаков, используемых при создании кластеров, 3) повторная выборка, 4) тесты значимости для независимых признаков, 5) методы Монте-Карло.
Название
процедуры
Алгоритм, с которым применяется
Сущность
Кофенетическая корреляция
Иерархический КА
Оценка того, насколько характер отношений (сходство/несходство) между объектами представляется дендрограммой, полученной с помощью алгоритма кластеризации
Тесты значимости для признаков, используемых при создании кластеров
Любой
Оценка значимости разбиения данных на кластеры с помощью методов многомерного дисперсионного анализа.
Повторная выборка
Любой
Проверка соответствия кластерного решения внутренней структуре совокупности, основанная на оценке степени повторяемости кластерного решения в серии случайных выборок из наблюдаемой совокупности объектов.
Тесты значимости для внешних признаков
Любой
Сравнение кластеров по признакам, не применявшимся в получении кластерного решения. Непосредственно проверяет достоверность кластерного решения по отношению к подходящему критерию.
Процедуры
Монте-Карло
Любой
Применение генераторов случайных чисел для создания наборов данных с основными характеристиками, соответствующими характеристикам реальных данных, но не содержащих кластеров. Одни и те же методы кластеризации применяются как к реальным, так и к искусственным данным, а полученные решения сравниваются.