Описательные статистические процедуры при анализе данных
Вопросы:
1. Типы переменных и соответствующие им статистические процедуры.
2. Диалоговые окна как ключевой элемент выполнения операций SPSS.
3. Описательная статистика и способы анализа в SPSS.
При работе с соц. данными социолог использует 2 понятия. Первое понятие единица анализа. Под ним понимается элементарная единичная часть объекта исследования. В социологии как правило такой единицей выступает респондент. Второе понятие – переменная. Это элементарный показатель, признак, характеризующий одно из свойств единицы анализа. Ключевыми характеристиками переменной является, во-первых то, что для каждой единицы анализа существует своё определенное значение переменной. Во-вторых – не все единицы анализа имеют одинаковое значение переменной.
В программе SPSS переменные описываются или задаются в специальном окне, которое называется «Переменные».
Каждая переменная в SPSS описывается отдельно исходя из следующих свойств:
· Имя переменной. При определении имени переменной необходимы соблюдать следующие правила:
1. Имена переменных могут содержать буквы латинского алфавита и цифры. Допускаются специальные символы _ . @ #. Не разрешаются пробелы, знаки других алфавитов и некоторые специальные символы типа ! ? «» *.
2. Имя переменной всегда должно начинаться. Последний символ имени не может быть . или знаком подчеркивания.
3. Длина имени переменной не превышает 8 символов. Имена переменных не чувствительны к регистру.
· Тип переменной. Переменные могут быть следующего типа: численные[Numeric] (к допустимым значениям относятся цифры перед которыми стоит знак + или -, знак + обычно перед числом не отображается) В текстовом поле «длина» для таких переменных задается максимальное количество знаков. В текстовом поле «десятичные разряды» вводится количество отображаемых знаков вводной части.
Строчная переменная (String). К допустимым значениям такой переменной относятся буквы, цифры и специальные символы. Строчные переменные бывают короткие и длинные. Короткие содержат не более 8 символов.
· Формат столбца
· Десятичные разряды.
· Метка переменной. Это название, позволяющее описать переменную более подробно. Допускается до 256 символов. В метках переменных различаются прописные и строчные буквы. Дает возможность описать возможные значения переменной (это варианты ответов). Для абсолютно каждого вопроса нужно прописывать метки.
· Пропущенные значения[Missing values]. В SPSS допускается 2 вида пропущенных значений, определяемые системой. Если матрица данных есть незаполненные численные ячейки то система SPSS самостоятельно определяет их как пропущенные значения. В матрице данных это отображается в виде запятой.
· Пропущенные значения, задаваемые пользователем. Если в определенном случае у переменных отсутствуют значения (например, не был дан ответ на вопрос). Ответ не известен или существуют другие причины, пользователь может определить эти значения как пропущенные. Их можно исключить из последующих вычислений.
Коды для пропущенных данных: 0 – нет ответа; 99 – вопрос не относится к респонденту, т.е. до этого стоял вопрос-фильтр. 98 – неправильная информация, например, отмечено 2 варианта ответа вместо одного. Также 98 – затрудняюсь ответить.
· Столбцы. Поле «Столбцы» определяет ширину, которую будет иметь в таблице столбец при отображении значений. Это поле можно задать в окне «Редактор данных».
· Выравнивание. Это вид выравнивания значений при отображении данных в таблице.
· Шкала измерения. В SPSS для каждой переменной необходимо задать шкалу, которая может быть: номинальной, порядковой или метрической. По умолчанию в SPSS задана метрическая шкала.
Типы шкал и допустимые для них операции с числами.
Шкала
Операции
Неупорядоченная номинальная шкала.
Простая группировка, классификация в натуральных единицах. Оценка центральной тенденции в показателях модальной группы, т.е. пункт шкалы с наибольшей численностью. Оценка рассеяния по пунктам в процентах от общей численности данных. При характеристике связей: оценки сопряженности по критерию хи-квадрат, коэффициенту Чупрова, Крамера и подобным мерам сопряженности.
Частично упорядоченная номинальная шкала
Все операции для номинальных шкал + а в случае приведения к полностью упорядоченной операции перечисленные ниже.
Порядковая, ординарная шкала (шкала рангов)
Монотонные преобразования шкалы и суммирование оценок. При характеристике центральной тенденции все операции работающие для номинальных шкал + расчет медианы. Для оценки рассеяния признаков то же, что и выше + оценка межквартильного диапазона. Для характеристики связи все операции представленные выше + коэффициент ранговой корреляции.
Интервальная метрическая шкала
При оценке центральной тенденции: расчеты моды, медианы, среднего арифметического. Показатели меры рассеяния те же, что и выше + оценка стандартного квадратического отклонения и дисперсии. При оценке связей всё выше перечисленное + коэффициенты парных и множественных корреляций.