7. КОЛЛЕКТИВНОЕ СТИМУЛИРОВАНИЕ ЗА ИНДИВИДУАЛЬНЫЕ РЕЗУЛЬТАТЫ
Простейшим обобщением базовой одноэлементной модели является многоэлементная ОС с независимыми (невзаимодействующими) агентами.
В этом случае задача стимулирования распадается на набор одноэлементных задач.Если ввести общие для всех или ряда агентов ограничения на механизм стимулирования, то получается задача стимулирования в ОС со слабо связанными агентами, представляющая собой набор параметрических одноэлементных задач, для которого проблема поиска оптимальных значений параметров решается стандартными методами условной оптимизации.
Если агенты взаимосвязаны, то есть затраты или/и стимулирование агента зависят, помимо его собственных действий, от действий других агентов, то получается «полноценная» многоэлементная модель стимулирования, описываемая ниже.
Последовательность решения многоэлементных и одноэлементных задач имеет много общего. Сначала необходимо построить компенсаторную систему стимулирования, реализующую некоторое (произвольное, или допустимое при заданных ограничениях) действие - первый этап - этап анализа согласованности стимулирования. В одноэлементных ОС в рамках гипотезы благожелательности для этого достаточно проверить, что при этом максимум целевой функции агента будет достигаться, в том числе и на реализуемом действии. В многоэлементных ОС достаточно
87
показать, что выбор соответствующего действия является равновесной стратегией в игре агентов. Если равновесий несколько, то необходимо проверить выполнение для рассматриваемого действия дополнительной гипотезы о рациональном выборе агентов. В большинстве случаев достаточным оказывается введение аксиомы единогласия (агенты не будут выбирать равновесия, доминируемые по Парето другими равновесиями), иногда центру приходится вычислять гарантированный результат по множеству равновесных стратегий агентов и т.д. Далее следует приравнять стимулирование затратам и решить стандартную оптимизационную задачу - какое из реализуемых действий следует реализовывать центру - второй этап - этап согласованного планирования - см. также второй раздел.
В большинстве рассматриваемых в теории управления моделей стимулирования изучаются одноэлементные ОС, состоящие из одного управляющего органа (центра) и одного управляемого субъекта - агента. В настоящем разделе описывается предложенный в [14] метод, заключающийся в выборе системы стимулирования, реализующей оптимальный с точки зрения центра вектор действий агентов как равновесие в доминантных стратегиях (РДС) [5], что позволяет декомпозировать игру агентов и получить аналитическое решение задачи стимулирования.