Смекни!
smekni.com

Математические методы исследования операций в экономике (стр. 35 из 37)

6.1.5. Решение матричных игр методами линейного программирования. Рассмотрим некоторые способы ре­шения матричных игр. Задача, решаемая первым игроком, (6.10) была сформулирована как максимизация наименьшей из сумм

но если определить некоторое хm+1, для которого выполняется

то она может быть сведена к задаче линейного программиро­вания:

при ограничениях

Проведя аналогичные рассуждения, приходим к тому, что задача минимизации наибольшего ожидаемого проигрыша, решаемая игроком II (6.12), сводится к задаче линейного програм­мирования

Таким образом, мы получаем возможность применять все возможности аппарата линейного программирования для поис­ка оптимальных стратегий обоих игроков.

Достаточно легко проверить, что задачи (6.16)-(6.17) и(6.18)-(6.19) образуют двойственную пару. Здесь в определен­ном смысле мы вернулись к проблемам, уже рассматривавшим­ся во второй главе, а именно к взаимосвязи между наличием ре­шения у некоторой оптимизационной задачи и существованием седловой точки у соответствующей функции Лагранжа. В дан­ном случае аналогичная связь прослеживается между седловой точкой игры и решением пары задач оптимизации.

6.1.6. Графические методы решения игр. Следует отме­тить, что применение для решения задач (6.16)-(6.17), (6.18)-(6.19) стандартных алгоритмов линейного программирования далеко не всегда является рациональным. Помимо этого суще­ствуют иные методы, которые основываются на использовании специфики данных задач. В настоящем пункте мы остановимся на очень простом классическом способе поиска оптимальных сме­шанных стратегий в матричных играх, где один из участников имеет только две стратегии (это так называемые 2 х п итх 2 игры).

Для определенности положим, что игрок I имеет возмож­ность выбирать между двумя стратегиями с вероятностями x1 и x2 = 1-x1, тогда его ожидаемые выигрыши, соответствующие чистым стратегиям игрока II, примут вид

или

т. е. ожидаемые выигрыши могут быть представлены в виде графи­ков линейных функций, зависящих от переменной x1∊ [0; 1] (рис. 6.1, где предполагается, что игрок II имеет три стратегии).

Линии, изображенные на рис.6.1, задают зависимости сред­него выигрыша игрока I от значения вероятности x1 , с которой он выбирает свою первую стратегию, для случаев, когда его противник выбирает первую, вторую или третью чистую стра­тегию. Тогда значениям минимального гарантированного дохо­да первого игрока соответствует нижняя огибающая всех трех прямых. Согласно принципу максимина, оптимальному выбору игрока I будет соответствовать наивысшая точка, лежащая на данной огибающей, отмеченная на рисунке как (x1*,z*). Зная ее, можно определить оптимальную смешанную стратегию перво­го игрока х* = (x1*, 1-x2*) и цену игры, равнуюz*.

Исходя из отношения двойственности, которым, как было ус­тановлено в п. 6.1.5, связаны задачи обоих игроков, по оптималь­ной стратегии первого участника х* однозначно определяетсяоптимальная стратегия его противника у*. Поскольку у*явля­ется результатом решения задачи линейного программирова­ния, то он обладает всеми свойствами допустимого базисного плана, т. е. в случае 2 х п игры имеет не более чем две ненулевых компоненты и не менее чем (п-2) нулевых. Номера ненулевых элементов у* определяются номерами линий, пересечение кото­рых определило оптимальную стратегию первого игрока. Дей­ствительно, игрок II знает оптимальную стратегию соперника, и применение им стратегий, соответствующих прямым, проходя­щим выше точки (х1*,z*), только увеличило бы его проигрыш.

В рассматриваемом примере это линии z2 и z3, и, следова­тельно, в своей оптимальной стратегии второй игрок должен с ненулевыми вероятностями применять вторую и третью чистые стратегии (у2>0, у3 >0). На основе этого, а также учитывая условие нормировки

можем выразить: y3 =l – y2 тогда оптимальное значение y2* мо­жет быть найдено из условия

или

В результате получаем оптимальную стратегию игрока II у*=(0, у2*, у3*).

Очевидно, что поиск решения в игре т х 2 осуществляетсяаналогичным образом с точностью до наоборот: строятся гра­фики ожидаемого проигрыша игрока II, находится их верхняя огибающая и т. д.

Безусловно, графический способ в силу ограниченности круга задач, к которым он может быть применен, имеет скорее теоретическое, чем практическое значение. Однако он хорошо иллюстрирует содержательную сторону процесса поиска реше­ния в игре.

6.2. ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

6.2.1. Постановка и классификация задач теории оп­тимального управления. В подавляющем большинстве рас­смотренных нами задач факторы, связанные с изменением изу­чаемых объектов и систем в течение времени, выносились за скобки. Возможно, при выполнении определенных предпосы­лок такой подход является конструктивным и правомерным. Однако очевидно и то, что это допустимо далеко не всегда. Су­ществует обширный класс задач, в которых необходимо найти оптимальные действия объекта, учитывающие динамику его состояний во времени и пространстве. Методы их решения со­ставляют предмет математической теории оптимального управ­ления.

В весьма общем виде задача оптимального управления мо­жет быть сформулирована следующим образом:

Имеется некоторый объект, состояние которого харак­теризуется двумя видами параметров — параметрами состояния и параметрами управления, причем в зависи­мости от выбора последних процесс управления объек­том протекает тем или иным образом. Качество про­цесса управления оценивается с помощью некоторого функционала*, на основе чего ставится задача: найти такую последовательность значений управляющих па­раметров, для которой данный функционал принимает экстремальное значение.

*Функционалом называется числовая функция, аргументами кото­рой, как правило, служат другие функции.

С формальной точки зрения многие проблемы оптимального управления могут быть сведены к задачам линейного или нели­нейного программирования большой размерности, так как каж­дой точке пространства состояний соответствует свой вектор неизвестных переменных. Все же, как правило, движение в дан­ном направлении без учета специфики соответствующих задачне приводит к рациональным и эффективным алгоритмам их ре­шения. Поэтому методы решения задач оптимального управле­ния традиционно связаны с другим математическим аппаратом, берущим свое начало от вариационного исчисления и теории интегральных уравнений. Следует также заметить, что опять-таки в силу исторических причин теория оптимального управ­ления была ориентирована на физические и технические при­ложения, и ее применение для решения экономических задач носит в определенном смысле вторичный характер. В то же вре­мя в целом ряде случаев модели исследования, применяющие аппарат теории оптимального управления, могут привести к содержательным и интересным результатам.

К сказанному выше необходимо добавить замечание о тес­ной связи, существующей между методами, применяемыми для решения задач оптимального управления, и динамическим про­граммированием. В одних случаях они могут использоваться на альтернативной основе, а в других довольно удачно дополнять друг друга.

Существуют различные подходы к классификации задач оп­тимального управления. Прежде всего, их можно классифици­ровать в зависимости от объекта управления:

- задачи управления с сосредоточенными параметрами;

- задачи управления объектами с распределенными парамет­рами.

Примером первых является управление самолетом как еди­ным целым, а вторых — управление непрерывным технологи­ческим процессом.

В зависимости от типа исходов, к которым приводят приме­няемые управления, выделяют детерминированные и стоха­стические задачи. В последнем случае результатом управле­ния является множество исходов, описываемых вероятностями их наступления.

По характеру изменения управляемой системы во времени различают задачи:

- с дискретно изменяющимся временем;

- с непрерывно изменяющимся временем.

Аналогично классифицируются задачи управления объекта­ми с дискретным или непрерывным множеством возможных состояний. Задачи управления системами, в которых время и со­стояния меняются дискретно, получили название задач управле­ния конечными автоматами. Наконец, при определенных ус­ловиях могут ставиться задачи управления смешанными системами.