1.4. Оценка значимости уравнения регрессии, его коэффициентов, коэффициента детерминации
F-критерий Фишера заключается в проверке гипотезы Но о статистической незначимости уравнения регрессии.
Для этого выполняется сравнение фактического FA
-л 2
i
(у- У)
r
2
n - m -1
F = m = •" ~, (1.5)
факт f \\ 2 1 - r2 m I (У - У) xy
n - m -1
где n - число единиц совокупности; m - число параметров при переменных. Для линейной регрессии m = 1 .
Для нелинейной регрессии вместо r2 xy используется R2. Fma6n - максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m, k2 = n - m - 1 (для линейной регрессии m = 1) и уровне значимости а.
Уровень значимости а - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно величина а принимается равной 0,05 или 0,01.
Если Fma6l < Fфaкm, то Н-гипотеза о случайной природе оцениваемых ха-рактеристик отклоняется и признается их статистическая значимость и надежность. Если Fma6l > Fфaкm, то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
Для оценки статистической значимости коэффициентов линейной рег-рессии и линейного коэффициента парной корреляции r применяется
ґ-критерий Стьюдента и рассчитываются доверительные интервалы каждого из показателей.
Согласно t-критерию выдвигается гипотеза Н0 о случайной природе показателей, т. е. о незначимом их отличии от нуля. Далее рассчитываются фактические значения критерия ґф^щ для оцениваемых коэффициентов регрессии и коэффициента корреляции r путем сопоставления их значений с величиной
стандартной ошибки
b a rxy
th =—; ґ =—; t .
b \'a \' r
mu m m
Ь a rxy
Стандартные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам
2
ост
5
m
Е (У - У.) /(n - 2)
X (Л - Л)2
\\
Е (Л - Л)2
ns^
ост 2 2
n S
m
S„
S
2
Л
X л2
VX
1\r\nЕ ( у - 2
-Ух ) X х2\r\n(n - -2) nX(х - Л )2\r\n
1 - r
1
ЛУ
m =
n - 2
Сравнивая фактическое и критическое (табличное) значения t-статистики ґтабл и ґфакт принимают или отвергают гипотезу Но.
tma6M - максимально возможное значение критерия под влиянием случайных факторов при данной степени свободы k = n-2 и уровне значимости а.
Связь между F-критерием Фишера (при k1 = 1; m =1) и t-критерием Стью- дента выражается равенством
t2 = b = t2 =4F.
rbr
Если ґтабл < ґфакт, то Но отклоняется, т. е.
a, b и rxy не случайно отличаютсяот нуля и сформировались под влиянием систематически действующего фактора х. Если ґтабл > ґфакт, то гипотеза Но не отклоняется и признается случайная природа формирования а, b или r .
Значимость коэффициента детерминации R2 (индекса корреляции) определяется с помощью F-критерия Фишера. Фактическое значение критерия Fфакт определяется по формуле
n - m -1
R2
F
факт
(1.6)
m
1 - R2
Fmcen определяется из таблицы при степенях свободы k1 = 1, k2 = n-2 и при заданном уровне значимости а. Если F^g, < Fфaкm, то признается статистическая значимость коэффициента детерминации. В формуле (1.6) величина m означает число параметров при переменных в соответствующем уравнении регрессии.