8. СТИМУЛИРОВАНИЕ ЗА РЕЗУЛЬТАТЫ КОЛЛЕКТИВНОЙ ДЕЯТЕЛЬНОСТИ
действий, но и от неопределенных и/или случайных факторов (см., например, модель теории контрактов в третьем разделе).
Настоящий раздел содержит формулировку и решение задачи коллективного стимулирования в многоэлементной детерминированной ОС, в которой центр имеет агрегированную информацию о результатах деятельности агентов.
Пусть в рамках модели, рассмотренной в предыдущем разделе, результат деятельности z e A0 = Q(A\') ОС, состоящей из n агентов, является функцией (называемой функцией агрегирования) их действий: z = Q(y).
Интересы и предпочтения участников ОС - центра и агентов - выражены их целевыми функциями. Целевая функция центра представляет собой разность между его доходом H(z) и суммарным вознаграждением u(z), выплачиваемым агентам:u(z) = У O, (z), где Oi(z) - стимулирование i-го агента,
ш
o(z) = (o1(z), o2(z), ..., On(z)), то есть
Ф(о( ¦), z) = H(z) - У s (z).
Целевая функция i-го агента представляет собой разность между стимулированием, получаемым им от центра, и затратами c,(y), то есть:
f,(s,(¦), y) = Oi(z) - c,(y), i e 1.
Примем следующий порядок функционирования ОС. Центру и агентам на момент принятия решений о выбираемых стратегиях (соответственно - функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС, а также функция агрегирования. Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их аген-там, после чего агенты при известных функциях стимулирования выбирают действия, максимизирующие их целевые функции.
В случае, когда индивидуальные действия агентов наблюдаемы для центра (или когда центр может однозначно восстановить их по наблюдаемому результату деятельности), последний может использовать систему стимулирования, зависящую непосредственно от действий агентов: " i e 1 O, (y) = o,(Q(y)).
Методы решениязадачи стимулирования для этого случая описаны в предыдущем разделе. Поэтому рассмотрим случай, когда центр наблюдает только результат деятельности ОС, от которого зависит его доход, но не знает и не может восстановить индивидуальных действий агентов, то есть, имеет место агрегирование информации - центр имеет не всю информацию о векторе y е A действий агентов, а ему известен лишь некоторый их агрегат z е A0 - параметр, характеризующий результаты совместных действий агентов.
Будем считать, что относительно параметров ОС выполнены предположения, введенные в предыдущем разделе, и, кроме того, предположим, что функция агрегирования однозначна и непрерывна.
Как и выше, эффективностью стимулирования является минимальное (или максимальное - в рамках гипотезы благожелательности) значение целевой функции центра на соответствующем множестве решений игры:
К(о()) = min Ф(о(), Q(y)).
yeP(a (¦))
Задача синтеза оптимальной функции стимулирования заключается в поиске допустимой системы стимулирования о , имеющей максимальную эффективность:
о* = arg max К(о()).
о (¦)
Отметим, что в рассмотренных в предыдущих разделах задачах стимулирования декомпозиция игры агентов основывалась на возможности центра поощрять агентов за выбор определенного (и наблюдаемого центром) действия. Если действия агентов не наблюдаемы, то непосредственное применение идеи декомпозиции невозможно, поэтому при решении задач стимулирования, в которых вознаграждение агентов зависит от агрегированного результата деятельности ОС, следует использовать следующий подход - найти множество действий, приводящих к заданному результату деятельности, выделить среди них подмножество, характеризуемое минимальными суммарными затратами агентов (и, следовательно, минимальными затратами центра на стимулирование при использовании компенсаторных функций стимулирования, которые оптимальны), построить систему стимулирования, реализующую это
подмножество действий, а затем определить - реализация какого из результатов деятельности наиболее выгодна для центра.
Перейдем к формальному описанию решения задачи стимулирования в ОС с агрегированием информации.
Определим множество векторов действий агентов, приводящих к заданному результату деятельности ОС:
Y(z) = {y e A\' | Q(y) = z} с A\