Выборочная дисперсия

До сих пор термин «дисперсия» использовался в смысле теоретической дисперсии (т. е. относящейся ко всей генеральной совокупности), как это и определялось в обзоре.

Для целей, которые прояснятся при обсуждении регрессионного анализа, целесообразно ввести понятие выборочной дисперсии (при этом будет сделано три важных замечания). Для выборки из п наблюдений х,,..., хп выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

Var(x) = ** X (х/ - х)2- (1-14)

Сделаем следующие три замечания:

Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. В приложении 0.3 показано, что s2, определенная как

—2(*,-їЛ

Я-1

является несмещенной оценкой а2. Отсюда следует, что ожидаемое значение величины Var(x) равно [(л — 1)/и]а2 и что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки п становится большим, то (и — 1)/и стремится к единице и, таким образом, математическое ожидание величины Var (х) стремится к а2. Можно легко показать, что ее предел по вероятности (plim) равен а2 и, следовательно, она явЛяется примером состоятельной оценки, которая смещена для небольших выборок.

Так как величина 52 является несмещенной, то в некоторых работах ее часто определяют как выборочную дисперсию и либо избегают ссылок на Var (х), либо дают ей какое-то другое название. К сожалению, общепринятой договоренности по этому поводу до сих пор нет[IV]. В каждой работе вам следует проверять определение.
Поскольку указанная договоренность отсутствует, отсутствует и договоренность относительно условного обозначения данного понятия, и для этого используются самые различные символы. В данной работе теоретическая (или генеральная) дисперсия переменной х обозначается как pop. var (х) или, если это удобно, а2. Если ясно, о какой переменной идет речь, то нижний индекс может быть опущен. Выборочная дисперсия всегда будет обозначаться как Var (х) с прописной буквы V.

Почему выборочная дисперсия в среднем занижает значение теоретической дисперсии? Причина заключается в том, что она вычисляется как среднеквадратичное отклонение от выборочного среднего, а не от истинного значения. Так как выборочное среднее автоматически находится в центре выборки, то отклонения от него в среднем меньше отклонений от теоретического среднего значения.

<< | >>

↑

Источник: Доугерти К.. Введение в эконометрику: Пер. с англ. — М.: ИНФРА-М,1999. — XIV, 402 с.. 1999

Еще по теме Выборочная дисперсия:

- Инвестиции - История экономики - Основы экономики - Платежные системы - Политэкономия - Рынок ценных бумаг - Ценообразование - Эконометрика - Экономика предприятия - Экономическая теория - Экономический анализ -