русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Общие параметры выборки


Дата добавления: 2013-12-24; просмотров: 2181; Нарушение авторских прав


Материалы, необходимые для проведения статистического анализа

 

Первым шагом при подготовке к проведению статистическо­го анализа данных в маркетинговых исследованиях является подбор исходных материалов, в которых содержатся основные параметры проводимого исследования. Обычно эти материа­лы включают в себя следующие документы.

1. Техническое задание на исследование (ТЗ) охватывает все общие параметры исследования: цели и задачи, планируе­мый размер выборки, информацию о квотах, методе и мес­те сбора данных, а также другую полезную информацию.

2. Структура аналитического отчета по результатам иссле­дования позволяет определить заранее, какие статистиче­ские процедуры понадобятся при написании аналитиче­ского отчета по исследованию.

3. Анкета для опроса является основой для составления схе­мы кодировки переменных в базе данных SPSS.

На основании ТЗ и структуры аналитического отчета исследова­тель должен еще до получения данных для анализа (заполненных анкет) составить план предстоящих манипуляций с анкетами рес­пондентов: преобразования данных, статистических процедур и методик. Исследователь должен приступить к обработке анкеты сразу после ее получения, не дожидаясь окончания полевых ра­бот: изучить ее структуру и составить перечень переменных, кото­рые впоследствии войдут в базу данных SPSS.

Основными выходными данными на названном этапе являются:

■ планируемый размер выборки;

■ структура выборки (наличие и размер квот);

■ вид опроса (личный, телефонный);

■ информация о параметрах опроса (наличие фактов фальсификации анкет);

■ схема (таблица) кодировки переменных в базе данных SPSS;

■ план-схема преобразования данных;

■ план-схема используемых статистических процедур.



Как вы увидите далее, эти данные являются весьма ценным ресурсом для последу­ющего статистического анализа.

Необходимо отметить, что на рассматриваемом этапе также можно выполнять и другие действия. Так, если заполненные анкеты вводятся в компьютер при по­мощи специализированного программного обеспечения (например, программы Data Entry или сканерного программного комплекса), на основании имеющейся анкеты и согласно целям и задачам исследования следует сформировать соответ­ствующие формы (для программы Data Entry) или создать шаблоны и макеты ан­кеты (для сканерного ввода). Только после успешного завершения этого подгото­вительного шага можно приступать к дальнейшим этапам.

 

 

Определение общих параметров выборки осуществляется после завершения полевых работ (когда собраны все анкеты). Данный этап состоит из ряда взаимосвязанных ша­гов. Это:

■ определение реального количества опрошенных респондентов;

■ определение структуры выборки;

■ распределение по месту опроса;

■ установление доверительного уровня статистической надежности выборки;

■ расчет статистической ошибки и определение репрезентативности выборки. Первое, что должно интересовать исследователя после получения заполненных анкет, — это количество респондентов. Оно может быть либо больше, либо мень­ше запланированного количества анкет. При этом первый вариант лучше с точки зрения статистического анализа, но хуже с точки зрения руководства фирмы, так как дополнительные анкеты являются незапланированными расходами на оплату работы интервьюеров. Второй вариант обычно хуже и с точки зрения анализа (вы­борка менее представительна), и с точки зрения руководства (заказчик будет не­доволен несоблюдением требований, оговоренных в ТЗ).

При оценке разницы между реальным и плановым размером выборки следует при­нимать в расчет разницу в статистической ошибке (см. ниже). Если она невелика (в ту или другую сторону), репрезентативность всей выборки существенно не стра­дает. Но если разница достаточно значима, выборка может оказаться непредстави­тельной. Кроме того, при определении общего размера выборки необходимо иметь в виду, что статистическая ошибка всей выборки относится только к общим распределениям. Разрезы существенно увеличивают статистическую ошибку. Поэто­му еще до начала опроса следует определить, какая численность каждой из инте­ресующих целевых групп респондентов является достаточной для построения ста­тистически значимых заключений и выводов.

Структура выборки может быть случайной (респонденты отбирались в случайном порядке) или неслучайной (респонденты отбирались на основании заранее извест­ных критериев, например методом квотирования). Эта информация важна при ин­терпретации результатов статистического анализа. Случайные выборки априори являются репрезентативными, так как на попадание/непопадание каждого респон­дента в выборку не влияют никакие факторы, кроме случайных. Представитель­ность неслучайных выборок не следует из их определения. Иногда они специально делаются нерепрезентативными относительно генеральной совокупности, однако могут являться весьма представительными относительно какой-либо одной инте­ресующей целевой группы (например, исследуется только мнение мужчин в воз­расте после 40 лет).

При анализе структуры выборки необходимо также изучить фильтрационные во­просы анкеты, то есть вопросы, специально предназначенные для отсеивания не подходящих под требования выборки респондентов. Несмотря на то, что такие вопросы позволяют исключить не нужные для конкретного исследования целе­вые группы, знание доли исключенных категорий позволит впоследствии соста­вить общее представление о параметрах всей генеральной совокупности.

Приведем пример. Методом телефонного опроса исследуется потребительский спрос на московском рынке творожной массы. При этом опрашиваются только лица, покупающие данный продукт, — для чего в анкету добавлен соответствующий фильтрационный вопрос. Однако в дальнейшем потребуется рассчитать емкость рынка исследуемого продукта. Решением данной задачи будет подсчет количества отсеянных респондентов (лиц, не покупающих творожную массу). Таким образом, впоследствии мы сможем определить долю покупателей творожной массы от об­щей численности населения Москвы.

Еще одна важная для исследователя характеристика выборки — это распределе­ние респондентов по месту опроса (личные интервью). Позже эти данные могут помочь при определении различий между респондентами, опрошенными в разных местах. (Очевидна разница в доходах между посетителями рынков и бутиков.)

Имея в своем распоряжении указанную выше информацию, можно приступать к определению представительности (или репрезентативности) выборки. Прежде всего необходимо установить уровень доверия к результатам опроса. Обычно в маркетинговых исследованиях используется уровень доверия 95 % и 99 %. Мы рекомендуем остановиться именно на первом варианте как на наиболее релевант­ном по отношению к маркетинговым исследованиям.

В зависимости от выбранного доверительного уровня определяется специфиче­ская константа г, участвующая в формуле расчета статистической ошибки выбор­ки. Константы доверительных уровней, наиболее часто используемых в маркетин­говых исследованиях, представлены в табл. 1.1.

 

Таблица 1.1. Константы доверительных уровней

Доверительный уровень Константа z
90 % 95 % 99 % ±1,64 ±1,96 ±2,58

 

Максимальная статистическая ошибка выборки рассчитывается по следующей формуле:

 

где — статистическая константа для соответствующего доверительного уровня; p= q = 50 % — вероятность наступления/ненаступления исследуемого события (то есть попадания/непопадания респондента в выборку); для случайных выборок данная ве­роятность равна 1/2 или 50 %; n — размер выборки (общее количество опрошенных).

Таким образом, для выборки в 1000 респондентов и при уровне доверия к резуль­татам опроса 95 % статистическая ошибка выборки будет равна:

 

 

Эта же статистическая ошибка используется для характеристики всех значений в вы­борке, выраженных в относительных величинах. То есть если в дальнейшем при по­строении линейных распределений по вопросам анкеты мы выясним, что 32 % рес­пондентов покупают газеты в киосках на улице, — это будет означать, что данное значение варьируется в пределах от 28,9 % (32 % - 3,1 %) до 35,1 % (32 % + 3,1 %).

Для расчета статистической ошибки значений переменных, выраженных в абсо­лютных величинах, применяется другая формула. При этом ошибка варьируется в зависимости от конкретной анализируемой величины. Ее расчет основан на по­строении линейных распределений и показан в разделе 2.1.

 



<== предыдущая лекция | следующая лекция ==>
От издательства | Ввод данных в компьютер и кодирование переменных


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.115 сек.