Унифицированные нормативные ранговые системы сти-мулирования.
т
следующим образом: о(у) = X qj ^ е [YJ, YJ+D), где Д) - функ-
j=0
ция-индикатор, Y0 = 0, q0 = 0. Унифицированная НРСС называется прогрессивной, если вознаграждения возрастают с ростом дейст-
вий: q0 ? qi ? q2 ?... ? qm. Эскиз графика прогрессивной УНРСС приведен на рисунке 53.
0
q
q2 qi
m\r\ns\r\n ^\r\n \r\n1 *
1 1
ь! \r\nJ
Yi Y2
Y
3
m
Рис. 53. Пример прогрессивной УНРСС
Так как УНРСС кусочно-постоянна, то в силу монотонности функций затрат очевидно, что агенты будут выбирать действия с минимальными затратами на соответствующих отрезках. Иначе говоря, условно можно считать, что при фиксированной системе
стимулирования множество допустимых действий равно
*
Y = {Yh Y2, ..., Ym}, причем, так как 0,(0) = 0, то q0 = 0. Действие y{ , выбираемое i-ым агентом, определяется парой векторов (Y, q), то есть имеет место y* (Y, q) = Yki, где
k = arg max {qk - o(Yk)}, i e I.
к = 0,m
>g<
Обозначим y (Y, q) = (y1 (Y, q), y2(Y, q), ..., yn(Y, q)). Задача
синтеза оптимальной УНРСС заключается в выборе размерности УНРСС m и векторов q и Y, удовлетворяющих заданным ограничениям, которые максимизировали бы целевую функцию центра:
Fy*(Y, q)) ® max .
Y ,q
Фиксируем некоторый вектор действий ye A\' = An, который мы хотели бы реализовать с помощью УНРСС.
Из того, что при использовании УНРСС агенты выбирают действия только из множества Y, следует, что минимальная размерность системы стимулирования должна быть равна числу
попарно различных компонент вектора действий, который требуется реализовать. Следовательно, использование УНРСС размерности, большей, чем п, нецелесообразно.
Поэтому ограничимся системами стимулирования, размерность которых в точности равна числу агентов, то есть положим т = п.Для фиксированного вектора действий ye A\' положим
*
Yi = yi , i e I, и обозначим cij = ci(YJ), i, j e I. Из определения реализуемого действия (см. (1)) следует, что для того, чтобы УНРСС реализовывала вектор ye A\' (то есть, побуждала агентов выбирать соответствующие действия) необходимо и достаточно выполнения следующей системы неравенств:
qi - сц > qj - Cij, i e I, j = 0, n .
Обозначим суммарные затраты на стимулирование по реализации действия y УНРСС
п
^УНРСС(У*) = X $ (У*),
i =1
где q(y*) удовлетворяет (3). Задача синтеза оптимальной (минимальной) УНРСС заключается в минимизации (4) при условии (3). Предположим, что агентов можно упорядочить в порядке
убывания затрат и предельных затрат ("y e A c^(y) > с2(у) > ... > сп (у)), и фиксируем некоторый вектор ye A\