Непреднамеренное использование замещающих переменных
Иногда случается, что вы используете замещающую переменную, не осознавая этого. Вы полагаете, что* зависит от z, а в действительности эта величина зависит от х.
Если корреляция между величинами z их незначительна, то результаты будут плохими, и вы поймете, что тут что-то неладно.
Но если корреляция тесная, то результаты окажутся удовлетворительными (коэффициент Л2 будет близок к желаемому уровню и т. п.), и вы можете даже не подозревать, что полученное соотношение неверно.Имеет ли это какое-то значение? Это, во-первых, зависит от того, с какой целью вы строите данную регрессию. Если целью оценивания регрессии является предсказание будущих значений величины *, то использование замещающей переменной не будет иметь большого значения при условии, конечно, что корреляция тесная и не является в то же время статистической счастливой случайностью. Однако если вы намерены использовать объясняющую переменную в качестве инструмента экономической политики для оказания влияния на поведение зависимой переменной, то последствия могут оказаться катастрофическими. Если только не будет функциональной связи между замещающей переменной и истинной объясняющей переменной, манипулирование замещающей переменной не окажет никакого влияния на зависимую переменную. Если мотивом построения регрессии является чисто научное любопытство, то исход будет столь же неудовлетворительным.
Непреднамеренное использование замещающих переменных особенно распространено при анализе временных рядов, в частности в макроэкономических моделях. Если истинная объясняющая переменная имеет временной тренд, то вы, вероятно, получите хорошую оценку формулы, если замените (преднамеренно или нет) ее на любую другую переменную с временным трендом. Даже если вы связываете приращения зависимой переменной с приращениями объясняющей переменной, вы, вероятно, получите аналогичные результаты независимо от того, используется ли правильная объясняющая переменная или же замещающая переменная, поскольку макроэкономические переменные обычно изменяются взаимосвязанно, в соответствии с экономическим циклом.
Упражнения
- В приведенной ниже таблице даны коэффициенты (с указанными в скобках стандартными ошибками) логарифмической регрессионной зависимости расходов на жилье: 1) от располагаемого личного дохода (dpi) и цены; 2) только от цены; 3) от цены и времени. Показатель dpi и цена, вычисленные поданным выборочного периода, оказались отрицательно коррелированными. Прокомментируйте результаты.
| Оценки коэффициентов | R2 | |||
| dpi | Ценв | t | ||
| (1) | 1,18 | -0,34 | — | 0,99 |
| (0,06) | (0,31) | |||
| (2) | — | -6,72 | — | 0,60 |
| (0,70) | ||||
| (3) | — | -0,63 | 0,041 | 1,00 |
| (0,13) | (0,001) | |||
- Используя данные по товару, выбранному вами в упражнении 2.4, постройте парную логарифмическую регрессионную зависимость спроса от относительной цены и множественную регрессионную зависимость спроса от относительной цены и времени (не включая dpi). Сопоставьте результаты со множественной регрессионной зависимостью спроса от располагаемого личного дохода и относительной цены, оцененной вами в упражнении 5.6. Сделали бы вы вывод, что время может служить удовлетворительной замещающей переменной для располагаемого личного дохода, если бы вам не удалось получить данные о последнем?
- Исследователь считает, что соотношение между годовым доходом индивида (у), числом лет трудового стажа (х) и количеством лет обучения (5) выражается формулой:
у = а + PjX + + и,
где и — случайный член. Исследователь располагает данными перекрестной выборки по у и S для 1000 человек, но не имеет прямых данных по х. Имеются данные о возрасте каждого индивида, а отсюда z — число лет, прошедших с момента официального завершения обучения, может быть вычислено по формуле:
г= Возраст -5-6,
исходя из предположения, что каждый индивид начал учиться в возрасте 6 лет. Подчеркните преимущества и недостатки построения регрессионной зависимости у: 1) только от величины 5; 2) от S и z, используя z в качестве замещающей переменной для х. Обсудите в каждом случае, каким образом должны интерпретироваться результаты регрессии и какие могут быть выполнены статистические тесты.
Еще по теме Непреднамеренное использование замещающих переменных:
- Замещающие переменные
- Несовершенные замещающие переменные
- Пример 2. Замещающая переменная для показателя дохода в функции спроса
- Пример 1. Время как замещающая переменная для показателя технического прогресса
- Использование фиктивных переменных в моделях с временными рядами
- Иллюстрация использования фиктивной переменной
- Использование инструментальных переменных для оценивания функции потребления Фридмена
- Использование сезонных фиктивных переменных
- Использование фиктивных переменных для проверки однородности наблюдений и прогнозирования
- Использование классификации издержек на постоянные и переменные для планирования прибыли
- Описать, как использование маркетологами переменных маркетинга способствует удовлетворению потребителей и достижения организационных целей.