русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Билет № 19.Статистические методы обработки маркетинговой информации


Дата добавления: 2015-08-14; просмотров: 2268; Нарушение авторских прав


Статистические методики обработки в большинстве случаев используются для работы с информацией, полученной в результате применения различного рода опросных методик.

Применение методов статистической обработки и анализа информации требует, чтобы необработанные данные должны сначала прошли предварительную подготовку, прежде чем для их анализа можно будет использовать статистические методы. Она является важным элементом статистической обработки. Качество результатов, полученных посредством использования статистических методов, и их последующая интерпретация в значитель­ной степени будут зависеть от того, насколько хорошо данные были подготовле­ны и конвертированы в форму, пригодную для анализа. Среди основных процедур подготовки данных можно перечислить следующие:

редактирование данных;

кодирование;

статистическая корректировка данных (если требуется).

Задача редактирования данных – выявление пропусков, неоднозначностей и не­точностей в ответах. Редактирование должно осуществляться как самим интервьюером и его руководителем в ходе сбора данных, так и аналитиком непосред­ственно перед их анализом. Среди проблем, которые должны выявляться, можно перечислить следующие.

Ошибки интервьюера – интервьюер не предоставил респонденту необходимые инструкции;

Пропуски – респондент не ответил на какой-либо вопрос — преднамеренно или из-за неспособности ответить;

Неоднозначности – ответ оказался неприемлемым или нечетким (например, непонятно, в каком из квадратиков поставлен значок при выборе из нескольких вариантов);

Непоследовательность – иногда нарушена логика в последовательности ответов (например, респондент, который является адвокатом, может отметить квадратик, показывающий, что он не окончил среднюю школу);

Недостаток сотрудниче­ства – если анкета длинная и содержит сотни вопросов, респондент может «взбунтоваться» и отметить один и тот же вариант (например, на шкале «согласен — не согласен») в длинной серии вопросов



Не соответствующий требованиям респондент – в выборку мог попасть не соответствующий требованиям респондент (например, если выборка состоит только из женщин старше 18 лет, все остальные должны быть исключены)

Для решения подобных проблем существует несколько вариантов действий. Лучше всего попытаться еще раз связаться с респондентом, особенно если вопро­сы, о которых идет речь, очень важны. Следующий вариант – просто не учиты­вать данную анкету. Такие действия будут оправданны, если очевидно, что рес­пондент либо не понял, как отвечать на анкету, либо не пожелал сотрудничать.

Менее экстремальный вариант – отбросить лишь проблемные вопросы, сохра­нив баланс остальных: некоторые респонденты могут пропускать вопросы, свя­занные, например, с возрастом или доходом, при этом нормально отвечая на ос­тальные. В той части анализа, которая связана с доходом или возрастом, будут учитываться лишь те респонденты, которые на эти вопросы ответили, однако для остального анализа можно использовать данные, полученные от всех участников. Еще один подход – кодировать все не соответствующие требованиям или пропу­щенные ответы как «не знаю» или «нет мнения». Такая методика может упрос­тить анализ данных, не внося существенных искажений в их интерпретацию.

Побочным продуктом процесса редактирования является то, что он позволяет оценить работу интервьюера и дать ему соответствующие наставления. Если ин­тервьюер постоянно допускает одну и ту же ошибку, то это выявляется в процес­се редактирования.

Кодирование – это технический прием, с помощью которого данные распределяются по категориям; он связан со спецификацией альтернативных категорий или классов, в которые должны омещаться ответы, а самим классам должны назначаться кодовые номера.

Посредством кодирования сырые данные превращаются в символы – обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразо­вание не должно осуществляться автоматически; оно требует здравого суждения кодировщика.

Первый этап кодирования заключается в уточнении категорий или классов, к которым будут относиться ответы. Не существует какого-то магического числа категорий. Скорее, это число будет зависеть от исследуемой проблемы и специальных позиций анкеты, используемых для генерирования информа­ции. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически по­падал в одну, и только одну, категорию. По ряду воп­росов правомерны и множественные ответы

Кодирование закрытых вопросов и большинства средств балльной оценки не представляет трудностей, потому что оно устанавливается при конструировании носителя собираемых данных. Затем респонденты ко­дируют себя своими ответами, или их кодирует тот, кто берет интервью, регистрируя ответы в предусмот­ренной для этого контрольной ведомости.

Кодирование открытых вопросов может оказаться весьма затруднительным и зачастую много более доро­гим, чем кодирование закрытых вопросов. Кодировщи­ку приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы. Меж­дународные исследования могут создавать особые про­блемы кодирования, поскольку разные понятия могут означать разные вещи.

Если анкет так много, что необходимо использовать нескольких кодировщиков, дополнительной пробле­мой может стать возникновение несоответствия в са­мом кодировании. Чтобы удостовериться в логической последовательности обработки данных, эту работу не­обходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками. Позволяя коди­ровщикам сосредоточивать энергию на одном или не­скольких вопросах, исследователи могут добиться уве­ренности в том, что для каждого вопроса будет применяться состоятельный набор стандартов. Такой подход более эффективен еще и по той причине, что кодировщики могут легко запоминать всего несколько кодов, и поэтому им не придется сверяться с книгой кодов, приступая к очередному носителю собранных данных. По существу, когда несколько лиц кодируют один и тот же вопрос в различных пачках анкет, важ­но, чтобы они же кодировали выборку работы других, что даст гарантию использования согласованного на­бора критериев кодирования.

Второй этап кодирования касается назначения ко­довых номеров классов. Например, мужской пол мо­жет обозначаться буквой М, а женский — буквой Р. Как альтернативный вариант, эти классы могут обо­значаться 1 — мужчина и 2 — женщина. Вообще гово­ря, для обозначения классов лучше использовать цифры, а не буквы. На этой стадии также лучше использо­вать цифры в том виде, как они зафиксировались в фор­ме сбора данных, а не раскладывать их на более мелкие категории. Например, если имеются данные о факти­ческом возрасте людей, не рекомендуется кодировать возраст как 1 = до 20 лет, 2 = 20-29 лет, 3 = 30-39 лет и т. д. Это привело бы к ненужной потере информации в ее исходном измерении, а если возникнет необходи­мость градации, это можно будет сделать с той же лег­костью на более поздней стадии анализа.

Когда для анализа данных предполагается использо­вать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину. Вне зависимости от того, как бу­дет обрабатываться ввод, либо с помощью чувстви­тельных к меткам форм, либо непосредственно через клавиатуру терминала, полезно обеспечить нагляд­ность ввода посредством многоколонной записи. Кро­ме того, рекомендуется следовать установившимся традициям кодирования данных.

Располагать только один символ в каждой колонке. Когда вопрос допускает множество ответов, разрешать отдельные колонки для кодирования каждого вариан­та ответа.

Использовать только числовые коды, а не буквы алфавита или специальные символы вроде @ или пробел. Для большинства компьютерных программ при обработке статистических данных манипулирование чем иным, чем цифры, сопряжено с трудностями.

Использовать ровно столько колонок поля, назначаемого для переменной, сколько необходимо для полного охвата всех ее возможных значений. Так, если переменная такова, что десяти кодов от 0 до 9 для охвата категории недостаточно, необходимо использовать две колонки, обеспечивающие 100 кодов от 00 до 99. Кроме того, любому полю должна назначаться не более чем одна переменная.

Использовать стандартные коды для «отсутствия информации». Так, все ответы «не знаю» должны кодироваться цифрой 8, «нет ответов» — цифрой 9, а «не применялось» обозначаться как 0. Лучше, если во всем исследовании для каждого из этих типов «нет информации» используется один и тот же код.

Кодировать в каждой записи идентификационный номер респондента. Как правило, нет и не будет необходимости идентифицировать в этом номере имя респондента. Этот код просто связывает анкету с кодирующими данными. Такая информация часто полезна на тапе очистки данных (обсуждается позднее). Если анкета координируется не с одной записью, то в каж­дой записи кодируются идентификационный номер респондента и порядковый номер. Колонка 10 первой записи может указывать, как респондент ответил на вопрос 2, а в колонке 10 второй записи могут содержаться данные о том, мужского или женского пола эта {персона.7

Завершающий этап процесса кодирования состоит в подготовке книги кодов, которая содержит общие инструкции, указывающие, каким образом была закоди­рована каждая позиция данных. В ней перечисляются коды каждой переменной и категории, включенные в каждый код. Далее в ней указывается, где в компью­терной записи располагается переменная и каким об­разом эта переменная читается – например, с десятич­ной точкой или как целое число. Последняя информация обеспечивается установлением формата.

Таким образом, книга кодов – это книга, в которой описывается каждая переменная, дается ее кодовое имя и идентифицируется ее местоположение в записи.После того как значения ответов введены в компьютерный файл, для получе­ния необходимой информации можно использовать компьютерную статистическую программу. Однако перед тем как проводить анализ данных, их необходимо проверить на предмет выявления ошибок, которые могли произойти в процесс ввода. После того как ошибки устранены, можно проводить статистическую корректировку данных.Существует много способов статистической корректировки данных, повышающих пригодность данных для анализа. Наиболее часто используемые процедуры статистической корректи­ровки данных приведены ниже.

Присвоение весов. Присвоение весов – это процедура, при которой каждому ответу в базе данных приписывается число в соответствии с некоторым заранее определенным правилом. Наиболее часто присвоение весов проводится для того, чтобы сделать данные по выборке более репрезентативными по некоторым характеристикам по отношению к целевой совокупности. Категориям респонден­тов, недостаточно представленным в выборке, присваивают больший вес, а тем, кого оказалось слишком много, – меньший. Присвоение весов производится так­же для того, чтобы увеличить или уменьшить в выборке число случаев, соответствующих определенным характеристикам.Присвоение весов также может использоваться для придания большей важности ответам респондентов с определенными характеристиками. Например, если исследование проводится с целью определения емкости рынка нового напитка для спортсменов, исследователь может присвоить больший вес мнениям молодых респондентов. Присвоение весов нужно использовать с осторожностью, вести за­писи о его проведении и включать информацию о нем в отчет об исследователь­ском проекте.

Переопределение переменных. Переопределение переменных — процедура, при которой существующие данные модифицируются таким образом, чтобы со­здать новые переменные, или несколько переменных объединяются с целью умень­шения их общего числа. Например, предположим, что первоначально переменная определяется как причина покупки машины с 10 категориями ответов. Эти кате­гории можно объединить в четыре группы: качество функционирования, внеш­ность, цена и обслуживание. Переопределение также может предполагать исполь­зование отношения двух переменных с целью создания новой, взятие квадратного корня и логарифмов, использование фиктивных переменных.Фиктивные переменные широко используются для переопределения перемен­ных, имеющих категории ответов. Их также называют двоичными, дихотомиче­скими или качественными переменными. Общее правило их использования вы­глядит так: если существуют определенное число уровней качественной переменной, для их определения используются число фиктивных переменных на одну меньше. Причина, по которой используются такое количество фиктивных переменных, состоит в том, что лишь такое число уровней (или категорий) являются независимыми, а информация по исключенному уровню может быть получена по оставшимся фиктивным переменным. Продукт можно ку­пить либо в течение первой, либо в течение второй половины года (качественная переменная с двумя уровнями). Поэтому время покупки может быть представле­но в виде всего одной фиктивной переменной. Эта переменная будет принимать значение «1» в случае, если продукт был приобретен в течение первой половины года, и «0» — если в течение второй.

Преобразование шкалы. Еще одна широко используемая процедура статисти­ческой корректировки данных — преобразование шкалы. Преобразование шкалы предполагает манипулирование значениями шкалы для того, чтобы обеспечить совместимость с другими шкалами. В одном и том же исследовании для измерен;: различных переменных могут использоваться различные шкалы. Таким образе сопоставление полученных по разным шкалам значений было бы бессмысленно. Даже если для всех переменных используется одна и та же шкала, разные респонденты могут использовать ее по-разному. Некоторые участники исследования могут постоянно использовать нижнюю часть порядковой шкалы, другие – верхнюю. Эти различия можно исправить, преобразовав данные соответствующим образом.Одной из наиболее часто используемых процедур преобразования шкалы является стандартизация. Стандартизация (нормирование) позволяет исследователю сравнивать переменные, для измерения которых были использованы шкалы различных типов. Например, если объем продаж измеряется в долларах, а цена – в центах, дисперсия объема продаж будет больше по сравнению с дисперсией цены – из-за различий единиц измерения. Для того чтобы сравнить дисперсии, обе переменные необходимо привести к одинаковым единицам измерения. Этого можно достичь посредством стандартизации: после нее среднее каждой переме­ной должно равняться нулю, а стандартное отклонение — единице. Математически это выглядит следующим образом: сначала производится вычитание среднего из каждой переменной, после чего она делится на стандартное отклонение. Стандартизацию можно проводить лишь с данными, которым соответствуют интервальная или относительная шкала. Дальнейшая обработка информации, полученной в ходе маркетингового исследования, предполагает осуществление табулирования данных, которое представляется собой первичный этап их анализа.Табулирование заключается просто в подсчете ко­личества событий, которые попадают в различные ка­тегории. Табулирование может принимать форму про­стой табуляции или перекрестной табуляции.Простая (или одномерная) табуляция – подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной пере­менной.Простая табуляция связана с подсчетом для един­ственной переменной. Она может повторяться для каждой из переменных исследования, но табуляция для каждой переменной не зависит от табуляции для других переменных.

Перекрестная табуляция – подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух и более переменных, рассматриваемых одновременно.

Перекрестная табуляция позволяет проверить наблюдается ли какая-либо взаимосвязь между рассматриваемыми переменными.

Табуляция может выполняться целиком от руки, целиком машиной или частично машиной и частично от руки. Какой из подходов более эффективен, зависит и от числа необходимых табуляций, и от количества событий в каждой табуляции. Число табуляций явля­ется прямой функцией количества переменных, тогда как количество событий — это прямая функция размера выборки. Чем меньшее число табуляций тре­буется и чем меньше выборка, тем более привлека­тельными становятся ручные методы. Однако привле­кательность любого подхода также в значительной степени зависит от сложности табуляций. Сложность возрастает по мере увеличения числа переменных, по­лучаемых для одновременной обработки в перекрест­ной табуляции. Сложность также возрастает с увели­чением числа категорий на одну переменную.

Хотя в очень простых исследованиях ручная табу­ляция может оказаться полезной, особенно если во­просов немного и число возможных ответов ограниче­но, большинство исследований полагается на компьютерную табуляцию, использующую пакеты программ. Существует громадное количество таких программ. Некоторые из них, в дополнение к отчет­ности о количестве событий в каждой категории, мо­гут рассчитывать итоговые статистики и графически представлять гистограммы значений. Базисный ввод для такого рода статистических анализов называется массивом данных, в котором перечисляются значе­ния каждой переменной для каждого блока статисти­ческой выборки. Каждая переменная занимает особое место в записи для блока выборки, что упрощает до­ступ к ее значениям для всех событий. Местоположе­ние каждой переменной определяется в книге кодов.Для дальнейшего статистического анализа и обработки маркетинговых данных могут применяться более сложные статистические аналитические методики, которые можно классифицировать следующим образом:

Вариационный (дисперсионный) анализ (ряд, распределение частот значений переменной) – математическое распределение, цель которого – подсчет ответов, связанных с различными значениями одной переменной (частот), и дальнейшее выражение их в процентном виде (частность).

Данный вид анализа используется при получении данных по таким вопросам как: влияет ли выбор канала сбыта на объем продаж? Влияет ли вид упаковки на объем продаж? Влияет ли цвет рекламного объявления на его запоминаемость? И др.

Регрессионный анализ – статистический метод установления формы и изучения связей между зависимой переменной и одной или несколькими влияющими переменными.

Данный вид анализа используется при получении данных по таким вопросам как: какова будет цена на товар в следующем году? Как влияет объем инвестиций в авиастроении на спрос на сталь и цветные металлы? Как изменится объем продаж, если расходы на рекламу увеличатся на 50%?Дискриминантный анализ – метод для анализа данных в том случае, когда зависимая переменная категориальная, влияющие переменные интервальные.Данный вид анализа используется при получении данных по таким вопросам как: можно ли считать достаточным основанием для выдачи кредита доход, возраст, образование человека? По каким наиболее существенным признакам можно определить эффективных продавцов и неэффективных? По каким признакам можно определить курящих и некурящих людей? И др.Факторный анализ – метод для сокращения числа переменных и их обобщения.

Данный вид анализа используется при получении данных по таким вопросам как: как можно охарактеризовать различные модели сотовых телефонов с учетом этих факторов? Можно ли сократить множество факторов, которые по мнению покупателей телефонов являются важными, до небольшого числа? И др.

Кластерный (классификационный) анализ – классификации объектов на относительно гомогенные (однородные) группы, исходя из рассматриваемого набора переменных.Данный вид анализа используется при получении данных по таким вопросам как: можно ли классифицировать избирателей с точки зрения их интереса к политике? Существуют ли различные категории читателей глянцевых журналов? Можно ли разделить покупателей на группы в зависимости от их потребностей? И др.

Совместный (сопряженный) анализ – это один из методов анализа зависимости, при котором выделяется одна зависимая переменная и ряд независимых и устанавливается влияние изменения независимых характеристик на зависимую величину.

Данный вид анализа используется при получении данных по таким вопросам различные уровни как: как характеристики продукта повлияют на степень его предпочтительности? др.

Многомерное шкалирование (ММШ, позиционирование) - ме­тоды для представления восприятий и предпочтений респондентов с помощью наглядного изображения на плоскости по четырем шкалам (линейкам).

Данный вид анализа используется при получении данных по таким вопросам как: каков имидж покупателя? Изменилось ли отношение покупателей к товару за последние 3 года? Насколько товар соответствует представлению покупателей об идеальном продукте? И др.

Анализ и обработка данных – не самоцель; они предназначены для получения информации, которая поможет решить имеющуюся проблему. На выбор соответствующего метода оказывают влияние несколько факторов, среди которых можно перечислить следующие:

цели исследования;тип данных;процедура проведения исследования;допущения, на которых основана статистическая проверка, и связанные с этим проблемы.При проведении комплексного исследования маркетологи исполь­зуют в большей или меньшей степени практически все перечисленные методы анализа. После проведения всестороннего анализа качествен­ной и количественной информации маркетологи должны сформулиро­вать выводы, дать рекомендации, разработать стратегию и др.



<== предыдущая лекция | следующая лекция ==>
Надежность и достоверность измерения маркетинговой информации | Билет № 20. Изучение потребителей: оценка уровня удовлетворения запросов, изучение отношений, изучение поведения, оценка намерений


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 3.024 сек.