Цель классификационного анализа — классификация респондентов и/или переменных по определенным целевым группам. Наиболее распространенными примерами использования классификационного анализа в маркетинговых исследованиях являются:
■ сегментирование респондентов по заранее известным (логистическая регрессия и дискриминантный анализ) или не известным (факторный и кластерный анализ) целевым группам;
■ классификация переменных по макрокатегориям, то есть сокращение их числа до нескольких значимых групп (факторный и кластерный анализ).
Далее в разделе мы рассмотрим эти статистические методики в указанном порядке, а также приведем примеры задач из практики маркетинговых исследований, решаемых с помощью классификационного анализа.
Логистическая регрессия и дискриминантный анализ применяются в том случае, когда необходимо классифицировать (сегментировать) респондентов по целевым группам, которые, в свою очередь, представлены уровнями (вариантами ответа) одной одновариантной переменной.
Примером задачи, решаемой при помощи этих статистических методов, может служить задача классифицировать респондентов по двум группам — покупающие горчицу и не покупающие горчицу — на основании их социально-демографических характеристик (пол, возраст, доход, количество членов семьи и т. п.). Как вы видите, в процедурах логистической регрессии и дискриминантного анализа присутствуют переменные — критерии сегментирования и одна переменная, кодирующая целевые группы, на которые следует разделить респондентов на основании критериев сегментирования.
Необходимо отметить, что спектр возможностей применения логистической регрессии уже, чем для дискриминантного анализа, поэтому использование дискриминантного анализа в качестве универсального метода предпочтительнее. Боле того, рекомендуется всегда начинать классификационное исследование именно с дискриминантного анализа, а не с логистической регрессии, — и применять последнюю в случае неуверенности в результатах дискриминантного анализа. Это связано, в частности, с тем, что при применении методов логистической регрессии еле дует четко представлять, какой тип имеют зависимая и независимые переменные и, исходя из этого, выбирать одну из трех возможных процедур логистической регрессии: бинарную, мультиномиальную или порядковую. При дискриминантном анализе мы всегда имеем дело только с одной статистической процедурой, в которой принимают участие одна категориальная зависимая переменная и несколько независимых переменных с любым типом шкалы. Таким образом, дискриминантный анализ является более универсальной методикой (что особенно важно для исследователей, имеющих незначительный опыт в статистическом анализе данных).
В разделах 5.1.1 и 5.1.2 мы на конкретных примерах покажем, как молено использовать процедуры логистической регрессии и дискриминантного анализа в маркетинговых исследованиях. При этом мы увидим, что, несмотря на преимущества универсального дискриминантного анализа, логистическая регрессия в некоторых случаях дает наивысшую четкость классификации.