В маркетинговых целях обычно проводят опрос лишь небольшой части той группы людей (генеральной совокупности), которая представляет интерес для исследователей. Обычно это несколько сотен, иногда — тысяча респондентов. Поэтому исходным пунктом расчета выборки становится вопрос об определении размеров выборочной совокупности. Ее численность зависит от двух факторов: стоимости сбора информации и стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь. Конечно, даже не искушенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки (чем ближе они к размерам генеральной совокупности в целом), тем надежнее и достовернее полученные данные. Понятно, что стоимость выборки (включающая в себя оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу) сильно зависит от суммы, которую готов выделить заказчик, и мало зависит от исследователей. Хотя если требуется увеличить точность вдвое, выборку придется увеличить не в 2, а в 4 раза. Например, чтобы сделать в 2 раза более точной оценку данных, полученных путем опроса 400 чел., потребуется опросить не 800, а 1600 чел.
Впрочем, вряд ли всякое маркетинговое исследование требует 100%-ной точности. Для пивовара, стремящегося узнать, сколько потребителей пива предпочитают именно его марку, а не сорт его конкурента — 60 или 40%, не имеет значения, будет это 57, 60 или 63%. Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри данной генеральной совокупности. Например, если нужно узнать, сколько потребляется пива, может обнаружиться, что внутри имеющейся генеральной совокупности нормы потребления у различных людей существенно различны (гетерогенная генеральная совокупность). В другом случае изучение потребления хлеба может показать, что у разных людей оно различается значительно меньше (гомогенная генеральная совокупность). Чем больше различия (гетерогенность) внутри генеральной совокупности, тем больше возможная ошибка выборки. Как справедливо утверждает В. Ядов, «численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы»3.
Определение объема выборки зависит и от уровня доверительного интервала допустимой статистической ошибки. Имеются в виду так называемые случайные ошибки, связанные с природой любых статистических погрешностей. В. Паниотто приводит расчеты репрезентативной выборки с допущением 5%-ной ошибки4 (табл. 1).
Таблица 1
Расчет репрезентативной выборки
Объем генеральной совокуп-ти
10 000
100 000
Объем выборки
Смысл этих расчетов сводится к следующему. Предположим, опрошены 400 жителей районного города с численностью взрослого платежеспособного населения 100 тыс. чел. Если выявлено, что 33% опрошенных предпочитают продукцию местного мясокомбината, то с 95%-ной5 вероятностью можно утверждать, что постоянными покупателями этой продукции являются 33,5% (т.е. от 28 до 38%) жителей.
Вообще данные расчетов, касающихся систематических ошибок выборки, являются результатом многолетних эмпирических наблюдений, расчетов, проверок и перепроверок. Одна из самых авторитетных в мире организаций по изучению общественного мнения — американский Институт Гэллапа — на основе многолетних прикладных исследований приводит следующие расчеты для оценки соотношения размеров выборки и ошибки выборки (табл. 2).
Таблица 2
Расчет величины ошибки при различных объемах выборки,%