Ложная регрессия

Очень часто экономические процессы бывают нестационарными. В качестве примера можно привести объем производства, уровень цен. Уровень безработицы как процент трудоспособного населения это, с другой стороны, пример стационарной переменной.

В данном случае термин "стационарность" употреблен не в строгом смысле. Скорее подразумевается, что дисперсия процесса ограничена.

Стационарность регрессоров является очень важным условием при оценивании регрессионных моделей. Если модель неверно специфицирована, и некоторые из переменных, которые в нее неправильно включены, являются 1(1), то полученные оценки будут очень плохими. Они не будут обладать свойством состоятельности, то есть не будут сходиться по вероятности к ис-тинным значениям параметров по мере увеличения размеров выборки. Привычные показатели, такие как коэффициент детерминации R , t-статистики, F-статистики, будут указывать на наличие связи там, где на самом деле ее нет. Такой эффект называют ложной регрессией.

Показать эффект ложной регрессии можно с помощью метода Монте- Карло. Сгенерируем достаточно много раз два случайных блуждания с независимыми нормально распределенными ошибками ~ NID(0,1)): Yt = Yt-1 + є, Xt = X-1 +

Оценив достаточно много раз регрессию Yt по константе и Xt вида Yt =a +bXt+ut мы получим экспериментальное распределение различных статистик. Например, эксперименты Монте-Карло показывают, что t-статистика для b при 50 наблюдениях и номинальном уровне значимости 5% в действительности отвергает верную гипотезу об отсутствии связи примерно в 75% случаев. Вместо того, чтобы использовать 5%-ю критическую границу t5% « 2 нужно использовать t5% =П11,2.

На рисунке показаны распределения коэффициента детерминации R2 (в процентах) при длине выборки в 50 наблюдений. Хотя процессы независи-

0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0

а)

0,08

0,07

0,06

0,05

0,04

0,03 I

0,02

0,01

0 0

10 20 30 40

80 90

100

й)

Yt = a + bXt + ut I(0) : X, Yt ~ NID (0,1)

I(1) : ДХ, AYt ~ NID (0,1)

I(2) : Д2Х, Д2Yt ~ NID (0,1)

а),в) — плотности распределения R ,

б) — (кумулятивные) функции распределения

мы, но регрессия с большой вероятностью дает высокий коэффициент детерминации из-за нестационарности. Два независимых 1(1)-процесса примерно в половине случаев дают коэффициент детерминации превышающий 20%.

Для 1(2)-процессов примерно в половине случаев коэффициент детерминации превышает 80% !

То же самое, хотя и в меньшей степени, можно наблюдать и в случае двух стационарных AR(1)-процессов с коэффициентом автокорреляции р близким к 1. Отличие заключается в том, что здесь ложная связь асимптотически (при стремлении размеров выборки к бесконечности) исчезает, а в случае 1(1)-процессов — нет. Все же проблема остается серьезной, поскольку на практике экономист имеет дело с конечными и часто довольно малыми вы-борками.

О процессе типа случайного блуждания без дрейфа говорят как о стохастическом тренде, поскольку влияние каждой ошибки не исчезает со временем.

Наличие обычного детерминированного тренда также может приводить к появлению ложной регрессии. Пусть, например Yt и Xt порождаются процессами Yt = a + b t +є, Xt = c + d t +gt, где єь E,t — независимые, одинаково распределенные ошибки. Регрессия Yt по константе и Xt может иметь высокий коэффициент детерминации и этот эффект только усиливается с ростом раз-мера выборки. К счастью, с "детерминированным" вариантом ложной регрессии достаточно легко бороться. В рассматриваемом случае достаточно добавить в уравнение тренд в качестве регрессора, и эффект ложной регрессии исчезает.

<< | >>

↑

Источник: М.П.Цыплаков. Некоторые эконометрические методы.Метод максимального правдоподобия. 1997

Еще по теме Ложная регрессия:

- Инвестиции - История экономики - Основы экономики - Платежные системы - Политэкономия - Рынок ценных бумаг - Ценообразование - Эконометрика - Экономика предприятия - Экономическая теория - Экономический анализ -