Фиктивные переменные как регрессоры
Термин "фиктивные переменные" используется как противоположность "значащим" переменным, показывающим уровень количественного показателя, принимающего значения из непрерывного интервала.
Как правило, фиктивная переменная — это индикаторная переменная, отражающая качественную характеристику. Чаще всего применяются бинарные фиктивные переменные, принимающие два значения, 0 и 1, в зависимости от определенного условия. Например, в результате опроса группы людей 0 может означать, что опрашиваемый — мужчина, а 1 — женщина. К фиктивным переменным иногда относят регрессор, состоящий из одних единиц (т.е. константу, свободный член), а также временной тренд.Фиктивные переменные, будучи экзогенными, не создают каких-либо трудностей при применении ОМНК. Фиктивные переменные являются эффективным инструментом построения регрессионных моделей и проверки гипотез.
Пример. (Проверка гипотезы о равенстве средних в двух выборках в предположении равенства дисперсий)
Нулевая гипотеза состоит в том, что случайные величины в двух выборках имеют одинаковое математическое ожидание. Альтернативная гипотеза состоит в том, что математические ожидания равны только в пределах выборок, но не между выборками. Предполагается, что величины нормально рас-пределены и дисперсии одинаковы для всех наблюдений. Объединим две выборки в одну. Пусть Y — вектор наблюдений для данной величины, Di — фиктивная переменная принимающая значение 0 для первой выборки и 1 для второй выборки. Тогда для проверки гипотезы оценим регрессионную модель:
Y = а + вDi + є i.
Нулевая гипотеза: в= 0. Альтернативная гипотеза: вф 0. Такую гипотезу можно проверить с помощью t-статистики для коэффициента в. а будет оценкой мат. ожидания для первой выборки, а$ + в$ для второй.
Предположим, что математическое ожидание зависимой переменной в регрессии увеличивается на некоторую фиксированную величину, если выполняется определенное условие. Пусть, например для выборки предприятий одной отрасли оценивается производственная функция Кобба-Дугласа.
Есть гипотеза, что для частных предприятий в этой отрасли производство при тех же труде и капитале выше, чем для государственных. Введем переменную Di, которая принимает значение 0 для государственных предприятий и 1 для частных. Регрессионное уравнение будет иметь вид: lnY - ln L i = а0 + а^ + в (ln K - ln L,).Если коэффициент а1 значимо положителен, то гипотезу нельзя отвергнуть.
Еще одна область применения фиктивных переменных — когда предполагается, что коэффициенты при "значащих" переменных меняются в зависимости от некоторого условия.
Пусть в приведенной модели в= в0 для гос. предприятий и в = в1 для частных. Тогда модель запишется в виде:
ln Yi - ln L i = а0 + а^ + в (ln K - ln L ) + + (в1 - в) Di (ln K - ln L i). Заменив параметры, получаем линейную относительно параметров модель.
В регрессионное уравнение может войти несколько фиктивных перемен-
A A
ных. Рассмотрим два условия: A и B. Пусть Di — индикатор условия A (Di = 1, если выполнено условие A, и 0 — если нет), Di — индикатор условия B.
AB A B
Тогда Di = DiDi — индикатор одновременного выполнения условий A и B. Эти три переменные будут точно описывать, в каком состоянии находится "мир" для данного наблюдения. Следует отметить, что четвертая фиктивная переменная (индикатор того, что одновременно не выполнены условия A и B) будет излишней в регрессии, уже включающей константу. Если ее добавить в регрессию, то матрица регрессоров будет вырожденной.
Дисперсионный анализ с фиксированными эффектами может быть све-ден к регрессионному анализу с фиктивными регрессорами. Проверке гипотез с помощью ковариационного анализа будет соответствовать проверка гипотезы о равенстве нулю коэффициентов при соответствующей группе фиктивных переменных.