Влияние включения в модель переменной, которая не должна быть включена
Допустим, что истинная модель представляется в виде:
у = а + Р,х, + и, (6.15)
а вы считаете, что ею является
у = а + р,х, + PjX2 + и, (6.16)
и рассчитываете оценку величины Ьх, используя формулу (5.12) вместо выражения Cov(x,,y)/Var (х,).
В целом проблемы смещения здесь нет, даже если Ьх будет рассчитана неправильно. Величина Е(6,) остается равной р,, но в общем оценка будет неэффективной. Она будет более неустойчивой, в смысле наличия большей дисперсии относительно Р,, чем при правильном вычислении. Это проиллюстрировано на рис. 6.2.
ь
Величина р,, оцененная по формуле (5.12) без использования информации о ч_ том, что р2=0
Величина Р,, оцененная по формуле Cov (х,, у) / Var (х,) с использованием
информации о том, что Р2=0
Рис. 6.2
Функция плотности вероятности
(6.17)
Это можно легко объяснить интуитивно. Истинная модель может быть записана в виде:
у = а + р,х, + 0х2 + и.
Таким образом, если вы строите регрессионную зависимость у от х, и х2, то А, будет являться несмещенной оценкой величины р,, а А2 будет несмещенной оценкой нуля (при выполнении условий Гаусса—Маркова). Практически вы обнаруживаете для себя, что р2 равно нулю. Если бы вы заранее поняли, что р2 равно нулю, то могли бы использовать эту информацию для исключения х2 и применить парную регрессию, которая в данном случае является более эффективной.
Утрата эффективности в связи со включением х2 в случае, когда она не должна была быть включена, зависит от корреляции между х, и х2. Сравните дисперсии величины А, при построении парной и множественной регрессии (табл. 6.5).
Дисперсия в общем окажется большей при множественной регрессии, и разница будет тем большей, чем ближе коэффициент корреляции к единице или —1. Единственным исключением в связи с проблемой утраты эффективности является вариант, когда коэффициент корреляции точно равен нулю. В этом случае оценка А, для множественной регрессии совпадает с оценкой для парной регрессии. Доказательство этого опустим, поскольку оно довольно простое.
Парная регрессия
Таблица 6.5
Множественная регрессия
pop. var (Aj) =
pop. var (А() =
яУаг(Х!)
It
/jVar(xj) * 1 -A
В выводе о несмещенности есть одно исключение, которое необходимо иметь в виду. Если величина х2 коррелирует с и, то коэффициенты регрессии будут в конечном счете смещенными. Если модель записать как уравнение (6.17), то это будет означать, что четвертое условие Гаусса—Маркова применительно к величине х2 не выполняется.
Еще по теме Влияние включения в модель переменной, которая не должна быть включена:
- Влияние отсутствия в уравнении переменной, которая должна быть включена Проблема смещения
- Какой должна быть корзина, к которую Вы сложите часть своих «яиц»
- Продукт или услуга должны быть законными, которые люди хотят (могут) купить на открытом рынке по розничной цене.
- Должны ли потребители быть постоянно удовлетворены? Должны ли продавцы работать над этой проблемой, чтобы достичь этой цели? Объясните ваш ответ.
- 4.2.3. Включение в модель регрессии фактора времени
- Должна ли ФРС быть независимой
- Ваша тактика не должна быть ориентирована на компанию
- Что должно быть сделано на местном уровне?
- Почему участники рынка должны быть заинтересованным в управлении информацией?
- Ваша тактика должна быть ориентирована на конкурентов
- 94. Сколько подписей должно быть собрано в поддержку всероссийского референдума?
- Ваша тактика не должна быть ориентирована на потребителя
- Титул IV. О том, что должно быть дано в определенном месте[123]