Кластерный анализ – многомерная статистическая процедура, упорядочивающая объекты в сравнительно однородные группы по ряду признаков. Классификация объектов производится на основании сходства между ними: схожие объекты попадают в одну группу (кластер), несхожие – в разные.
Диаграмма распределения двух переменных «Общий стаж работы» и «Стаж работы на предприятии» демонстрирует наличие трех относительно однородных групп (кластеров):
К 1 – работники, имеющие большой общий трудовой стаж, значительная часть которого связана с работой на обследованном предприятии;
К 2 – работники, имеющие средний общий трудовой стаж, значительная часть которого не связана с работой на обследованном предприятии;
К 3 – работники, имеющие небольшой общий трудовой стаж, непродолжительное время работающие на обследованном предприятии.
Помимо этого имеется 4 изолированных объекта, не присоединившихся ни к одному кластеру.
С помощью КА решаются задачи следующих типов:
1. Разработка типологии или классификации объектов
2. Исследование концептуальных схем группировки объектов
3. Порождение гипотез на основе исследования данных
4. Проверка гипотез для определения того, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.
В большинстве исследований, использующих КА, применяется комбинация этих задач.