<<
>>

ИГРЫ С НУЛЕВОЙ СУММОЙ Майкл Бахарах

Zero-sum Games

Michael Bacharach

Для теории игр игры с нулевой суммой являются тем же, чем двенадцатитактовый блюз для джаза: одновременно и крайним случаем, и исторической отправной точкой.

Игрой называется ситуация, характеризующаяся: 1) наличием множества агентов (игроков), у каждого из которых имеется множество альтернативных линий поведения или стратегий; 2) наличием исходов, зависящих от комбинации действий игроков и определяющих предпочтения игроков на множестве этих комбинаций; 3) тем, что каждый игрок знает, каковы эти предпочтения у всех других игроков, и знает, что они известны всем остальным. (Строго говоря, такая ситуация называется игрой с полной информацией в нормальной форме — в дальнейшем мы будем иметь в виду именно ее.) В литературе по играм с нулевой суммой рассматриваются, как правило, два игрока, скажем, А и В, в распоряжении которых имеется конечное множество стратегий, а их предпочтения могут быть описаны функциями полезности фон Неймана — Моргенштерна. Такую структуру предпочтений можно представить в виде матрицы платежей, в которой элемент, стоящий на пересечении /-й строки и у-го столбца, т.е. (иу, vtj), обозначает ожидаемые полезности или платежи соответственно игроков Ап В, если первый игрок выбирает стратегию /, а второй — стратегию j. Если в игре такого типа utj + vtj = 0 для всех / и j, то эта игра носит название матричной игры с нулевой суммой (в дальнейшем мы называем ее просто игрой с нулевой суммой). В таких играх предпочтения игроков в отношении каждой пары стратегий в точности противоположны, поэтому у них нет никаких оснований действовать как пара или команда, т.е. никаких причин для сотрудничества (кооперативных действий). Поэтому теории кооперативных игр с нулевой суммой не может быть в принципе: такие игры, по определению, являются некооперативными, и каждый игрок должен выбирать свою стратегию в условиях неопределенности относительно выбора другого.

На рис. 1 приводится матрица платежей игры с нулевой суммой, которую можно назвать «Битва в Новогвинейском море». Как принято в играх с нулевой суммой, в матрице отражены только платежи игрока, выбирающего строки (поскольку тем самым заданы и платежи игрока, выбирающего столбцы, — это те же числа, только с противоположными знаками. — Примеч. пер.). Генерал Кенни (игрок А) должен решить, искать ли ему японский флот в северном направлении (стратегия а,), где видимость плохая, или в южном (стратегия а2); японский командующий (игрок В) решает, плыть ли ему северным (стратегия Р,) или южным путем (стратегия Р2). Платеж для Кенни есть ожидаемое число дней, в течение которых он сможет бомбить вражеский флот.

B\'s strategies
A\'s strategies Pi P2
2 2
«2 1 3

Рис. 1

Фон Нейман и Моргенштерн (Neumann and Morgenstem, 1944) разработали аппарат теории игр как часть теории рационального действия, изучающую групповые взаимодействия людей, при том что результат этих взаимодействий, т.е. платежи для каждого из агентов, существенным образом зависят от решений других агентов. В такой ситуации характеристика того или иного действия как рационального оказывается проблематичной, что прекрасно понимали фон Нейман и Моргенштерн. Основная теоретическая проблема состоит в том, что будут делать А и В, если каждый из них стремится достичь лучшего для себя результата. Но то, какое действие будет лучшим для А, зависит от того, что будет делать В, т.е. от того, что лучше всего для В, и т.д. до бесконечности. Фон Нейман и Моргенштерн полагали, что они отыскали удовлетворительное решение этой фундаментальной проблемы для специального случая игр с нулевой суммой.

Это решение обусловило популярность таких игр.

Сильная сторона теории фон Неймана — Моргенштерна состоит в том, что для широкого класса игр (игр с нулевой суммой) любой из двух совершенно независимых друг от друга принципов рационального поведения дает один и тот же совершенно определенный ответ на вопрос о том, как же должны себя вести игроки. Столь высокая степень внутренней непротиворечивости теории, проявляющаяся во взаимном подтверждении двух ее постулатов, возможно, привела к несколько преувеличенной оценке достоинств каждого из этих постулатов самого по себе. Эти два постулата или принципа рационального действия называются «принципом равновесия» и «принципом максимина». «Принцип равновесия» гласит, что стратегии а* и р* рациональны лишь тогда, когда каждая из них есть наилучший ответ на другую, т.е. когда а* максимизирует и(ct, р*), а р* максимизирует v(a*, Р), где и (а, Р) и v(a, Р) означают платежи игроков А и В соответственно, если выбрана пара стратегий (а, Р). (Термин «ответ» надо понимать метафорически, поскольку в данном случае нет непосредственной коммуникации.) Такая пара стратегий в теории игр называется некооперативным равновесием, или равновесием по Нэшу. В данном случае ввиду того, что и(а, р) = —v(a, р), ее нередко называют также седловой точкой, поскольку она задает максимум и на множестве а и минимум и на множестве р. «Принцип равновесия» нередко понимался слишком поверхностно, однако в его защиту выдвигалось и немало строгих аргументов (см., например: Johansen, 1981). Фон Нейман и Моргенштерн отчетливо осознавали, что он может служить не более чем необходимым условием рационального выбора игроков: если рациональные стратегии существуют, они, как можно доказать, должны отвечать этому принципу, однако для их существования требуются другие, независимые причины (Нейман и Моргенштерн, 1944 (1970), разд. 17. 3).

«Принцип максимина» гласит, что игрок А должен максимизировать на множестве а минимум и(а, р) на множестве р, т.е. искать «мак- симин» и, а В должен искать максимин v или, что эквивалентно, «ми- нимакс» и.

Другими словами, А следует максимизировать свой уровень безопасности, который для стратегии а есть не что иное, как minp и(а, р) — наихудший исход, который может дать ему стратегия а; а В надлежит минимизировать свои уровень риска таха и(а, Р) — наилучший исход, который может дать стратегия р его сопернику. Этот принцип неоднократно подвергался критике, и его принятие (с некоторыми оговорками) в конечном счете было отчасти обязано тому обстоятельству, что он удачным образом сочетался с другими положениями теории фон Неймана — Моргенштерна. Их собственная аргументация в его защиту была скорее интуитивной, чем строгой: они утверждали, что принцип максимина отражает рациональную осторожность игрока, не имеющего веских оснований для того, чтобы приписать определенные вероятности отдельным стратегиям оппонента. Второй аргумент (не стоящий своих авторов) был справедливо раскритикован Элсбергом (Ellsberg, 1956); в соответствии с ним, рациональным для игрока А может быть решение, принятое им при том предположении, что он принимает пассивную стратегию («Minorant game»), соответствующую матрице платежей. В такой игре А делает первый ход, а В — второй, зная, как сыграл А (иначе говоря, А выступает в роли «лидера по Штакельбергу»). В такой ситуации жесткие правила выбора в условиях определенности действительно делают для А рациональной стратегию максимина. Однако нет никаких убедительных оснований в пользу того, что А должен воспринимать ситуацию именно так.

В игре с Новогвинейским морем легко видно, что набор максимин- ных пар стратегий совпадает с набором седловых точек. Этот факт наглядным образом иллюстрирует общее правило (теорема 1): если в игре с нулевой суммой имеется седловая точка, то определяющая ее пара стратегий будет седловой тогда и только тогда, когда эта пара представляет собой максимин. Теорема 1 утверждает, что два принципа выбора совпадают. Кроме того, оба принципа однозначно определяют решение, что утверждает теорема 2: если в игре с нулевой суммой есть седловая точка, то каждая максиминная стратегия одного игрока в сочетании с соответствующей максиминной стратегией другого игрока дает один и тот же платеж.

Значимость этих результатов несколько обесценивается тем, что их справедливость ограничивается играми, в которых есть хотя бы одна седловая точка, — во многих играх их нет вообще. В качестве решения этой проблемы фон Нейман и Моргенштерн предложили несколько расширить множество стратегий игроков в произвольной игре с нулевой суммой, с тем чтобы гарантировать существование седловой точки. Предложенный ими хитроумный способ состоял в том, чтобы наделить игроков устройствами, генерирующими случайный выбор (своего рода рулетками). Формально это означало, что к стратегиям а,, ... ат добавлялись стратегии вида «играть а, с вероятностью рх и... и ат с вероятностью рт, где рх + ... + рт = 1». Исходные стратегии а,,..., ат получили название чистых, а новые, производные от них — смешанных стратегий. При этих условиях стало возможно доказать, что (теорема 3) в любой игре с нулевой суммой тахашііір н(а, Р) lt; minpmaxa и(а, Р), причем равенство имеет место тогда и только тогда, когда в игре имеется седловая точка. Таким образом, расширение множества стратегий, повышающее максимальный уровень безопасности игрока А, приводит к тому, что для игр данного класса гарантируется существование седловой точки. Разрешив игроку А «смешивать» свои стратегии, мы создаем страхующее устройство, приводящее именно к этому результату. Уровень безопасности стратегии а есть то, что А может получить, играя эту стратегию против оппонента, в точности предвидящего его действия. Правда, не следует забывать, что на практике даже и в этом случае игрок А сможет сыграть только какую-то одну из своих чистых стратегий, [которым данная смешанная стратегия приписывает отличную от нуля вероятность]. Тем не менее, в общем случае применение смешанных стратегий повышает уровень безопасности игрока А потому, что в их присутствии противник с некоторой вероятностью [выберет не самую опасную для А стратегию и] не сможет нанести ему максимальный урон.

Тот факт, что этот маневр фон Неймана — Моргенштерна оказался удачным, находит свое выражение в самой, пожалуй, знаменитой теореме теории игр — так называемой теореме о минимаксе.

Она гласит, что в каждой (матричной) игре с нулевой суммой и смешанными стратегиями существует седловая точка. Теорема о минимаксе является естественным аналогом теорем 1 и 2 для множества всех игр с нулевой суммой и смешанными стратегиями. Первые доказательства теоремы о минимаксе были основаны на использовании теоремы о неподвижной точке, однако она может быть доказана и «по построению», основываясь на свойствах выпуклых множеств (см.: Gale, 1951). Основные принципы этого метода для случая, когда у игрока А имеются две чистые стратегии, могут быть разъяснены при помощи рис. 2.

Обозначим чистые стратегии игрока А через а, и а2, а стратегии игрока В — через р,, ..., Рл. Введем также q = (qx, ..., qn) — вектор смешанных стратегий, при которых В играет Ру. с вероятностью qJJ = 1,..., п). На рис. 2 показан случай, когда п = 4; по осям отложены платежи игрока А при стратегиях а, и otj соответственно. Координаты вершин 37 многоугольника R соответствуют двум платежам игрока А при двух его

чистых стратегиях в тех случаях, если В сыграет чистую стратегию Ру, а все остальные точки R соответствуют комбинациям двух платежей А при всех возможных смешанных стратегиях В. к примеру, абсцисса точки Neсть и(а,, д) при q = (0, 0, 1/2, 1/2). На каждой линии, аналогичной линии Р/Р2 уровень риска для В одинаков — таким образом, этот игрок минимизирует свой уровень риска в точке М (другие, не показанные на рисунке точки минимального риска лежат на вертикальных линиях, аналогичных РХКР2, и в вершине Yx многоугольника R). В точке М игрок В использует смешанную стратегию q*(q*, 1 - q*, 0, 0), где q* = MY2/Yx Y2, а игрок А получает платеж и* при любой своей чистой или смешанной стратегии — обозначим этот платеж через OQx. Как область QxMQ20, так и область R выпуклы. Рассмотрим разделяющую их линию /: она получена как продолжение линии У, У2, так что ее уравнение может быть записано в виде р*их + (1 - р*)и2 = и*, где 0 lt; р* lt; 1. Если через р* обозначить смешанную стратегию, при которой А играет стратегию а, с вероятностью р*, то пара (р*, д*) и будет искомой седловой точкой. В самом деле, с одной стороны, все стратегии А дают один и тот же платеж, если оппонент играет д*, так что р* максимизирует этот платеж. С другой же стороны, поскольку / есть определенная выше разделяющая линия р*их + (1 — Р*)и2 gt; и* для всех (и,, и2) из R, то платеж А при его стратегии р* составит не менее и* при любой стратегии В.

Теорема о минимаксе показывает, что два принципа рационального выбора Неймана — Моргенштерна совпадают друг с другом во всех играх с нулевой суммой, если в распоряжении игроков имеются смешанные стратегии. Однако, к сожалению, сама предпосылка о допустимости смешанных стратегий отнюдь не естественна. Мало того, что правила игры или объективные ограничения могут исключать возможность применения таких стратегий, сама мысль о том, что рациональные игроки должны применять смешанные стратегии, содержит в себе определенное противоречие. Дело в том, что чистая стратегия, выбранная при помощи рулетки, может оказаться менее безопасной, чем другие варианты, так что индивид, максимизирующий минимальный платеж, имеет все основания пересмотреть свое решение. Более того, он может предвидеть это заранее.

Следует сказать несколько слов и о том, как на практике сбываются предсказания фон Неймана — Моргенштерна относительно поведения индивидов в играх с нулевой суммой. Изо всех таких данных самыми существенными являются результаты лабораторных экспериментов. В ходе этих экспериментов, как правило, одна и та же ситуация сначала объясняется участникам на словах, после чего они участвуют в ряде игр с гипотетическими или небольшими реальными платежами. Противником в такой игре может быть как другой участник, так и компьютерная программа. Основная проблема в подобных экспериментах состоит в том, чтобы заставить участников при принятии решения в ходе игры руководствоваться исключительно своими платежами, не «привнося» влияний каких бы то ни было посторонних факторов, — например, полезностей выигрыша своих оппонентов. В большинстве поставленных экспериментов участники однозначно не действовали так, как того требует теория, хотя в некоторых случаях исходы начинали стремиться к равновесным по мере накопления опыта. Не следует, конечно, забывать о том, что отклонения от поведения, соответствующего седловой точке, могут быть рациональными, если индивид имеет рациональные основания полагать, что его оппонент сам отклоняется от такого поведения. Однако это объяснение неудовлетворительно, поскольку участники, как правило, не использовали тех возможностей, которые предоставлялись им организаторами эксперимента, закладывавшими в программу неседловые стратегии оппонентов. Наконец, индивиды не проявляли особой склонности и к использованию смешанных стратегий.

Впрочем, эти эксперименты были поставлены с целью исследования эмпирического феномена, а не собственно того вопроса, на который Нейман и Моргенштерн предложили свой, по их мнению, убедительный ответ: какие стратегии рациональны в играх с нулевой суммой. Вклад этих двух авторов в решение именно такой задачи поистине можно назвать революционным, хотя на практике люди и не спешат следовать такому решению. При всей элегантности, формальной строгости и содержательной глубине теории, предложенной Нейманом и Моргенштерном, на другой чаше весов лежат так и не разрешенные сомнения в адекватности самой чистой теории рационального принятия решений вообще и в играх с нулевой суммой в частности.

Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. Colman, А. 1982. Game Theory and Experimental Games. Oxford: Pergamon. Ellsberg, D. 1956. Theory of the reluctant duelist. American Economic Review 46, December, 909-23.

Gale, D. 1951. Convex polyhedral cones and linear inequalities. In Activity Analysis of Production and Allocation, ed. T.C. Koopmans, New York: Wiley.

Johansen, L. 1981. Interaction in economic theory. Economic appliquee 34(2—3), 229-67.

Von Neumann, J. and Morgenstem, O. 1944. Theory of Games and Economic Behavior. Princeton: Princeton University Press.

<< | >>
Источник: Дж. Итуэлл, М. Милгейт, П. Ньюмен. Экономическая теория / Под ред.: Пер. с англ. / Науч. ред. чл.-корр. РАН B.C. Автономов. — М.: ИНФРА-М,2004. — XII, 931 с.. 2004

Еще по теме ИГРЫ С НУЛЕВОЙ СУММОЙ Майкл Бахарах:

- Авторское право - Аграрное право - Адвокатура - Административное право - Административный процесс - Антимонопольно-конкурентное право - Арбитражный (хозяйственный) процесс - Аудит - Банковская система - Банковское право - Бизнес - Бухгалтерский учет - Вещное право - Государственное право и управление - Гражданское право и процесс - Денежное обращение, финансы и кредит - Деньги - Дипломатическое и консульское право - Договорное право - Жилищное право - Земельное право - Избирательное право - Инвестиционное право - Информационное право - Исполнительное производство - История - История государства и права - История политических и правовых учений - Конкурсное право - Конституционное право - Корпоративное право - Криминалистика - Криминология - Маркетинг - Медицинское право - Международное право - Менеджмент - Муниципальное право - Налоговое право - Наследственное право - Нотариат - Обязательственное право - Оперативно-розыскная деятельность - Права человека - Право зарубежных стран - Право социального обеспечения - Правоведение - Правоохранительная деятельность - Предпринимательское право - Семейное право - Страховое право - Судопроизводство - Таможенное право - Теория государства и права - Трудовое право - Уголовно-исполнительное право - Уголовное право - Уголовный процесс - Философия - Финансовое право - Хозяйственное право - Хозяйственный процесс - Экологическое право - Экономика - Ювенальное право - Юридическая деятельность - Юридическая техника - Юридические лица -