Модели с бинарной зависимой переменной
20
для описания этой ситуации.
Она предполагает, что зависимая переменная имеет непрерывное распределение, а здесь необходимо, чтобы она имела дискретное распределение.Пусть, например, рассматривается выбор группы людей: быть безработным или работать. Построенная линейная регрессия будет предсказывать абсурдные значения Y - дробные, отрицательные и большие единицы. Математическое ожидание остатков при этом будет даже асимптотически зависеть от X.
Вообще говоря, предсказывать результат выбора можно было бы и по ре-
л 1
зультатам линейной регрессии: если Y (расчетное значение Y) больше V2, то
л 1
берем 1, если Y меньше V2, то берем 0. Хотя это соображение и не улучшает модель, оно подсказывает, какой может быть более адекватная модель.
С формальной точки зрения требуется найти модель, которая порождала бы дискретное распределение, зависящее от X, которое бы хорошо описывало данные. Поскольку для бинарной зависимости переменной распределение будет бинарным, то оно полностью определяется вероятностью получения единицы (как функцией X), которая совпадает с математическим ожиданием, если переменная принимает значения 0 и 1:
E (Y | X) = Prob (Y = 1 | X)1 + Prob (Y = 0 | X) 0 =
=Prob (Y = 1 | X).
Геометрически задача состоит в том, чтобы найти гиперплоскость, которая бы в определенном смысле наилучшим образом разделяла две группы наблюдений (соответствующие 0 и 1) в пространстве регрессоров. Может случиться, что такая плоскость будет не единственной; это происходит при идеальном разделении.
Еще по теме Модели с бинарной зависимой переменной:
- Модели с дискретной зависимой переменной
- Множественные модели с качественными зависимыми переменными
- Модели с качественной зависимой переменной
- Преобразование зависимой переменной. Модель Бокса-Кокса
- Ошибки измерения зависимой переменной
- Автокорреляция с лаговой зависимой переменной
- Иллюстрация: модель с двумя независимыми переменными
- Экзогенные переменные в модели
- Предопределенные переменные модели
- Эндогенные переменные модели
- Использование фиктивных переменных в моделях с временными рядами
- Модели общекорпоративных зависимостей
- Влияние включения в модель переменной, которая не должна быть включена
- 16.2.1. Оценка стоимости европейского бинарного опциона с выплатой денег
- 4.1. Модели принятия решений об объемах закупок фирмой - оптовым покупателем в зависимости от изменения отпускных цен производителя и спроса конечных покупателей
- 4.2. Модели принятия решений об объемах закупок фирмой - оптовым покупателем в зависимости от оценки объемов предстоящих розничных продаж
- 4.2. Модели принятия решений об объемах закупок фирмой - оптовым покупателем в зависимости от оценки объемов предстоящих розничных продаж