Классификация является основой человеческой умозрительной деятельности. Дети очень рано начинают классифицировать объекты, окружающие их, и давать названия получаемым классам. Классификация является фундаментальным процессом научной практики, поскольку системы классификаций содержат понятия необходимые для разработки теорий в науке.
“Кластерный анализ”- это общее название множества вычислительных процедур, используемых при создании классификации. В результате работы с процедурами образуются “кластеры” или группы очень похожих объектов. Более точно, кластерный метод -это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы.
Первые работы, упоминающие о кластерных методах, появились давно, но большая часть литературы по кластерному анализу была написана в течение последних двух десятилетий. Эффективная процедура для создания биологических классификаций должна обеспечивать сбор всевозможных данных об интересующих организмах, оценивать степень сходства между этими организмами и применять некоторый метод кластеризации, чтобы поместить достаточно схожие организмы в одну и ту же группу. После этого состав каждой группы можно проанализировать, чтобы выяснить, представляют ли они разные биологические виды. Структура замеченных различий и сходств между организмами может служить основой для понимания эволюционного процесса.