Взаимодействие переменных. Предположим, что мы рассматриваем пару фиктивных переменных: X1 - для выделения группы женатых и X2 - для выделения группы "начальников", а прогнозируем с помощью уравнения регрессии все тот же доход: Y=B0+B1*X1+B2*X2.
Это уравнение моделирует ситуацию, когда действие факторов X1 и X2 складывается, т.е. считается, к примеру, что женатый начальник имеет зарплату B1+B2, не женатый начальник B2. Это достаточно смелое предположение, так как, скорее всего, закономерность не так груба и существует взаимодействие между факторами, в результате которого их совместный вклад имеет другую величину. Для учета такого взаимодействия можно ввести в уравнение переменную, равную произведению X1 и X2:
Произведение X1*X2 равно единице, если факторы действуют совместно и нулю, если какой либо из факторов отсутствует.
Аналогично можно поступить для учета взаимодействия обычных количественных переменных, а также индексных переменных с количественными.
Для получения переменных взаимодействия, следует воспользоваться средствами преобразования данных.
Использование фиктивных переменных для угла наклона. В рассмотренных примерах одновременного включения в модель количественных и номинальных (порядковых) переменных, последние преобразовывались в наборы фиктивных переменных так, что получаемые регрессионные прямые шли параллельно друг другу (например, модель (4.23) рисунок 4.22). В примере (4.23) это означает, что, зависимость успеваемости от уровня предварительной подготовки у юношей и девушек одинакова, только у юношей исходный уровень подготовки ниже. Аналогичный подход, фактически, заложен в изложенном выше подходе использования фиктивных переменных.
С точки зрения содержательных социологических моделей предположение о параллельности регрессионных прямых для различных социальных групп в большинстве случаев выглядит надуманным. Возможно ли в рамках регрессионного подхода преодолеть это ограничение? Можно, причем с использованием тех же фиктивных переменных.
При введении фиктивных переменных для изменения угла наклона регрессионная модель будет выглядеть следующим образом.
y =b0+(b1+b2Q1) x1+b3Q1 (4.28)
, где x1 – количественная переменная, Q1 – фиктивная переменная. Выражение (4.28) можно переписать в следующем виде:
y =b0+b1 x1+b2Q1x1+b3Q1 (4.28)
Поскольку переменная Q1 является фиктивной, то уравнение (4.28) представляет собой два уравнения. Одно для ситуации Q1=0, а другое – Q1=1 (уравнение 4.29).
y =
b0 + b1 x1 +
b2x1 +
b3
(Q1=1)
(4.29)
y =
b0 + b1 x1
(Q1=0)
Построение модели (4.28) дает регрессионную модель с разными углами наклона для двух разных уровней Q1.
[1] Наряду с термином «фиктивные переменные» в русскоязычной литературе для таких переменных используются так же термины «Индексные переменные», «Псевдопеременные». В англоязычной литературе всегда используется только один термин – Dummy variables.
[2] Данные для расчета этой модели взяты из всероссийского опроса, проведенного ВЦИОМ в мае 2001 года в рамках исследования «Мониторинг социальных и экономических перемен».
[3] Данные для расчета этой модели взяты из всероссийского опроса, проведенного ВЦИОМ в мае 2001 года в рамках исследования «Мониторинг социальных и экономических перемен».
Понятие фрактала и история появления фрактальной графики. Понятие размерности и ее расчет.
Геометрические фракталы. Алгебраические фракталы. Системы итерируемых функций. Стохастические фракталы.