Что происходит, когда стандартное отклонение величины b неизвестно?
До сих пор мы считали, что стандартное отклонение величины b известно. Однако на практике это допущение нереально. Это можно показать на примере стандартной ошибки для величины Ь, взятой из уравнения (3.27).
Это приводит к двум изменениям процедуры проверки гипотез. Во-первых, величина Zonpe- деляется на основе использования стандартной ошибки с.о. (Ь) вместо стандартного отклонения s.d. (b) и носит название /-статистики:, Ь - Ро t-і лч\\
с.о.(А) ’ (3-43)
Во-вторых, критические уровни t определяются величиной, имеющей так называемое /-распределение вместо нормального распределения. Мы не будем вдаваться в причины этого или даже описывать /-распределение математически. Достаточно будет сказать, что оно родственно нормальному распределению, а его точная форма зависит от числа степеней свободы в регрессии, и оно все лучше аппроксимируется нормальным распределением по мере увеличения числа степеней свободы. Вы, конечно, уже встречали понятие /-распределения во вводном курсе статистики. В табл. А.2 в конце книги представлены критические значения для /, сгруппированных по уровням значимости и числу степеней свободы.
Оценивание каждого параметра в уравнении регрессии поглощает одну степень свободы в выборке. Отсюда число степеней свободы равняется количеству наблюдений в выборке минус количество оцениваемых параметров. Параметрами являются постоянный член (при условии, что он введен в модель регрессии) и коэффициенты при независимых переменных. В рассматриваемом случае парной регрессии оцениваются только два параметра аир, поэтому число степеней свободы составляет и - 2. Следует подчеркнуть, что, когда мы перейдем к множественному регрессионному анализу, потребуется более общее выражение.
Критическое значение /, которое мы обозначим как tKpum, заменит число 1,96 в уравнении (3.39). Таким образом, условие того, что оценка регрессии не должна приводить к отказу от нулевой гипотезы р = Р0, будет следующим:
ОМ)
lt; А~Ро lt;t
1 крит lt; С0(А) lt; Врит-
Примеры
В разделе 2.6 функция расходов на питание оценивалась как зависимость от личного располагаемого дохода на основании совокупных ежегодных данных для
США за 25-летний срок (1959—1983 гг.) и уравнение регрессии было представлено формулой (2.42):
у = 55,3 + 0,093х (3.45)
- (0,003)
Цифры, указанные в скобках, являются стандартными ошибками.
Предположим, что одна из задач оценивания регрессии состояла в подтверждении догадки о том, что уровень расходов на питание зависит от размера дохода. Соответственно, мы формулируем нулевую гипотезу о том, что величина Р равняется нулю, и затем пытаемся опровергнуть ее. Соответствующая t-статистика, вычисленная по формуле (3.43), есть оценка коэффициента, деленная на ее стандартную ошибку:
Ь-Ро 6-0 _ 0,093
с.о.(6) с.о.(6) 0,003 ’ \' (3.46)
Так как в выборку включено 25 наблюдений и мы оценили два параметра, то число степеней свободы составляет 23. Критическое значение для t при 5-про- центном уровне значимости с 23 степенями свободы равняется 2,069. Причем /-статистика не лежит между значениями 2,069 и -2,069. Следовательно, неравенство (3.44) не выполняется и мы отвергаем нулевую гипотезу, сделав вывод о том, что величина р в действительности отличается от нуля и, следовательно, размер дохода влияет на уровень расходов на питание.
Если этот критерий описать словами, то верхний и нижний 2,5-процентные «хвосты» /-распределения начинаются со стандартного отклонения 2,069 вверх и вниз от его математического ожидания, равного нулю. Коэффициент регрессии, который по оценкам находится в пределах 2,069 стандартного отклонения от гипотетического значения, не приводит к отказу от последнего. В рассматриваемом случае расхождение будет эквивалентно 31,0 стандартного отклонения, и мы приходим к выводу о том, что результат оценивания регрессии противоречит нулевой гипотезе.
Конечно, в том, что мы используем уровень значимости в 5% в качестве основы для проверки гипотезы, существует 5-процентный риск допущения ошибки I рода. В этом случае мы могли бы снизить риск до 1% за счет применения уровня значимости в 1%. Критическое значение для / при однопроцентном уровне значимости с 23 степенями свободы составляет 2,807. Используя это число в соотношении (3.44), мы видим, что можно легко отказаться от нулевой гипотезы также и при этом уровне значимости.
Процедура установления взаимосвязи между зависимой и объясняющей переменными путем формулирования, а затем отклонения нулевой гипотезы о том, что Р = 0, используется очень часто. Соответственно, большая часть, если не все программы регрессии, автоматически выводят /-статистику для этого специального случая; иными словами, коэффициент делится на его стандартную ошибку. Данное отношение часто обозначается как «/-статистика».
Если, однако, нулевая гипотеза определяет некоторое ненулевое значение величины р, то необходимо использовать более общее выражение (3.43), а /-статистика вычисляется вручную. Например, вновь рассмотрим модель регрессии между общей инфляцией и инфляцией, вызванной ростом заработной платы (3.34), и предположим, что выбранное уравнение регрессии оказалось следующим (в скобках указаны стандартные ошибки):
р = —1,21 + 0,82w. (3.47)
(0,05) (0,10)
Если теперь исследовать гипотезу о том, что общая инфляция в долгосрочном периоде будет равна инфляции, вызванной ростом заработной платы, то нулевая гипотеза будет состоять в том, что коэффициент при w равен 1,0. Соответствующая /-статистика примет вид:
А-Ро _ 0,82-1,00 _
0,10“ "_1Д (З-48)
Если в выборке содержится, скажем, 20 наблюдений, то число степеней свободы составит 18, а критическое значение для / при 5-процентном уровне значимости будет 2,101. В этом случае/-статистика лежит между 2,101 и —2,101, поэтому мы не отвергаем нулевую гипотезу. Оценка, равная 0,82, лежит ниже нашего гипотетического значения 1,00, но не настолько ниже, чтобы исключить возможность правильности нулевой гипотезы.