Проверка гипотезы о наличии гетероскедастичности известного вида
Выдвинем явную гипотезу о виде гетероскедастичности в регрессии:Wi(y) = h(Zf),
где h(.) —дифференцируемая строго монотонная функция, такая что h(0) = 1, Zty— линейная комбинация известных переменных Z с неизвестными коэффициентами у.
2 2
Дисперсия ошибки i-го наблюдения равна
Функция правдоподобия i-го наблюдения будет иметь вид:1 2 1 2 1i = - 2 ln(2n< h(ZY) - 2< h(ZiY) (Yi - Xi в)2.
Как мы уже видели, информационная матрица в модели обобщенного МНК имеет блочно-диагональную форму, поэтому гипотезы о у можно проверять независимо от в. Поэтому в дальнейшем будем рассматривать градиент функции правдоподобия и информационную матрицу только в той части,
2 2 T
которая относится к у и < , которые вместе составляют вектор а= (< , у) .
Для проверки гипотезы об отсутствии гетероскедастичности удобнее всего использовать LM-тест (нулевая гипотеза H0: у= 0), поскольку для него не требуется оценивать модель при уф0. Достаточно оценить регрессию обычным методом наименьших квадратов.
Найдем вклад в градиент i-го наблюдения:
д1і 1 1 g2 !— + i
д< 2< 2< h(ZijY)\'
д1
д< 2
1 g} „ 1
2 (~2 - 1) = Г-2 Hi.
ЗА = — 1 h\'(ZlY) 1 h\'(ZiV) 2Z ду 2 h(Zif) Zi 2< h2(Zir)g Z
h\' (0)
д?і ду
H0 2< < 2< ш л
ft Zi.
Ho
2 (а2 " 1) Zi = 2
Si
Здесь мы обозначили /л, = 2 - 1 и воспользовались тем, что h(0) = 1. Ин-
а
формационную матрицу удобно находить через матрицу вкладов в градиент.
Воспользуемся тем, что Eft2) = 2, поскольку для нормального распределения
2 4
Е(а) = 1 и E(O0 = 3. Отсюда получим при выполнении нулевой гипотезы
1
1
ді
да
діі ді± 2
E02)=зо? E(ft2)=О
h\' (0)
Е(да2 др = 4а2 E(ft) Zi = 2а2 Zj
(h \' (0)):
діі ді, х (h -(0)) :
E(
дуду ) 4 E(ft ) ZjZi 2 ZjZi .
Таким образом, информационная матрица равнаN h\' (0) ¦
2 а"
(ші
4
XNN = E(Gn0GN0) =
2 а
2
т
Lу 7т у 77
2а2 ^Zi 2 ZZi
2 4 1Т1 ^ 1TZ
2 а, 2а
т.ZТі ^Z TZ
2а 2
1
где 1 — вектор-столбец, составленный из N единиц. Если обозначить
* 1 h\'(0) ч
то
1N = Z * TZ *.
аа
Статистика множителя Лагранжа для проверяемой гипотезы равна
LM = gN (іОГ^»
где градиент и информационная матрица берутся в точке (P, а ; 0) оценок ОМНК.
2 1 - Z -), где Hi = _ 2
Градиент равен ga = (ттг 1 —, 2 Z —), где Д- = ті - 1, Є — остатки из
2< 2 <
2
регрессии. (Оценка дисперсии < , полученная методом максимального прав
доподобия такова, что 1т— = 0, о. е. производная функции правдоподобия
*
равна нулю.) В терминах матрицы Z
~ 1 ry *T~
ga= фZ
В таком случае можно заметить, что LM-статистика равна объясненной
1 *
сумме квадратов из регрессии — її Z или, что то же самое, половине объ-
*
ясненной суммы квадратов из регрессии — її Z :
LM = ^2 -Z *(Z * TZ У1^- Z *T—= 1 -Z *(Z * TZ *)-1Z *T—.
Если домножить регрессоры на отличные от нуля константы, то подпро-
*
странство, которое на них натянуто, не изменится. Поэтому регрессия — її Z дает ту же самую объясненную сумму квадратов, что и регрессия — її 1 e Z. Таким образом, окончательно получаем, что LM-статистика для тестирования гетероскедастичности равна половине объясненной суммы квадратов из регрессии — її константе e Z. Статистика распределена асимптотически как x2(r), где r — размерность вектора у.
Примечательно, что в этой статистике не фигурируют производные функции h(.), формула будет одна и та же независимо от выбора h(.). Когда статистика множителя Лагранжа одна и та же для широкого класса альтернативных гипотез, тогда эти альтернативные модели принято называть локально эквивалентными альтернативами.