Выборочная дисперсия
До сих пор термин «дисперсия» использовался в смысле теоретической дисперсии (т. е. относящейся ко всей генеральной совокупности), как это и определялось в обзоре.
Для целей, которые прояснятся при обсуждении регрессионного анализа, целесообразно ввести понятие выборочной дисперсии (при этом будет сделано три важных замечания). Для выборки из п наблюдений х,,..., хп выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:Var(x) = ** X (х/ - х)2- (1-14)
Сделаем следующие три замечания:
- Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. В приложении 0.3 показано, что s2, определенная как
—2(*,-їЛ
Я-1
является несмещенной оценкой а2. Отсюда следует, что ожидаемое значение величины Var(x) равно [(л — 1)/и]а2 и что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки п становится большим, то (и — 1)/и стремится к единице и, таким образом, математическое ожидание величины Var (х) стремится к а2. Можно легко показать, что ее предел по вероятности (plim) равен а2 и, следовательно, она явЛяется примером состоятельной оценки, которая смещена для небольших выборок.
- Так как величина 52 является несмещенной, то в некоторых работах ее часто определяют как выборочную дисперсию и либо избегают ссылок на Var (х), либо дают ей какое-то другое название. К сожалению, общепринятой договоренности по этому поводу до сих пор нет[IV]. В каждой работе вам следует проверять определение.
- Поскольку указанная договоренность отсутствует, отсутствует и договоренность относительно условного обозначения данного понятия, и для этого используются самые различные символы. В данной работе теоретическая (или генеральная) дисперсия переменной х обозначается как pop. var (х) или, если это удобно, а2. Если ясно, о какой переменной идет речь, то нижний индекс может быть опущен. Выборочная дисперсия всегда будет обозначаться как Var (х) с прописной буквы V.
Почему выборочная дисперсия в среднем занижает значение теоретической дисперсии? Причина заключается в том, что она вычисляется как среднеквадратичное отклонение от выборочного среднего, а не от истинного значения. Так как выборочное среднее автоматически находится в центре выборки, то отклонения от него в среднем меньше отклонений от теоретического среднего значения.
Еще по теме Выборочная дисперсия:
- Теоретическая дисперсия выборочного среднего
- Правила расчета дисперсии
- Выборочная ковариация
- Дисперсия
- Дисперсия дискретной случайной величины
- Альтернативное выражение для выборочной ковариации
- Противоречия между несмещенностью и минимальной дисперсией
- 4.3. Выборочный контроль
- Выборочный метод
- Теоретическая дисперсия дискретной случайной переменной
- Выборочная оценка распределения градиента и оценок максимального правдоподобия