Величина называется верхней ценой игры или минимаксом. Ей соответствует минимаксная стратегия второго игрока.
Имеет место неравенство:
.При < первый игрок может существенно увеличить свой средний выигрыш по сравнению с , если он будет пользоваться не чистой (одной единственной стратегией), а так называемой смешанной стратегией.
Смешанная стратегия С состоит в том, что при повторении игры происходит случайный выбор стратегий из некоторого множества смешиваемых стратегий и для каждой смешиваемой стратегии указывается вероятность ее выбора.
Известно, что для любой КПИНС существует пара оптимальных стратегий (вообще говоря смешанных).
Свойство оптимальности означает, что любое отступление одного из игроков от оптимальной стратегии (при условии, что второй игрок продолжает придерживаться своей оптимальной стратегии) при многократном повторении игры может только уменьшать его средний выигрыш (увеличить средний проигрыш).
Величина выигрыша (может быть, отрицательного) первого игрока при пользовании парой оптимальных стратегий называется ценой игры и обозначается .
Цена игры заключена между нижней и верхней ценой игры:
.Стратегии, которые смешиваются для получения оптимальной стратегии, будем называть полезными.
Решить игру - это значит найти пару оптимальных стратегий и цену игры. Решение игры обладает одним важным свойством: если один из игроков использует свою оптимальную стратегию, а другой смешивает свои полезные стратегии в любых пропорциях (не обязательно оптимальных), то средний выигрыш продолжает оставаться равным цене игры. При этом, правда, как при любых отступлениях от оптимальной стратегии, соответствующее изменение стратегии противником может привести к увеличению его среднего выигрыша.
Известно, что у игры m´n число полезных стратегий с каждой стороны не превосходит минимального из чисел m и n.
В области чистых стратегий решение может быть получено непосредственно. Если же решение нужно искать в области смешанных стратегий
, то в общем случае m´n матрицы применяется следующий прием.Считая все m стратегий первого игрока полезными, определяют вероятность их применения в смешанной оптимальной стратегии (если какая-то стратегия в действительности бесполезна, то соответствующая вероятность обратится в нуль). Пусть искомые вероятности обозначаются
, а цена игры (пока неизвестная) - .Так как при оптимальной стратегии средний выигрыш первого игрока не меньше при любой стратегии противника, то ищем n неравенств:
Вводим новые неизвестные:
.Чтобы исключить деление на нуль, можно всегда добиться
. Для этой цели достаточно ко всем элементам матрицы прибавить одно и тоже положительное число с и все ее элементы сделать положительными. Эта операция увеличит цену игры на с, но не изменит искомых оптимальных стратегий.Так как
= 1, то .Таким образом, имеем систему неравенств:
где все
.Так как цель оптимальной стратегии – максимизация выигрыша, то при ее достижении линейная функция:
должна обратиться в минимум. Итак, оптимальная стратегия первого игрока (т.е. набор вероятностей
) находятся в результате минимизации функции:при
, удовлетворяющих системе неравенств (8.1).Таким образом, получили задачу линейного программирования. Методы решения таких задач известны. В результате ее решения находим не только оптимальную стратегию первого игрока, но и цену игры
.Зная цену игры, оптимальную стратегию (а1, а2, ..., аn) второго игрока можно находить уже без решения задачи линейного программирования (хотя оптимальную стратегию второго игрока можно находить и через решение этой задачи, если поменять игроков местами). Для этого выбирается n-1 полезных стратегий первого игрока (имея возможность менять местами игроков можно считать, что
) и для каждой из них записывается средний выигрыш, который при этом должен быть обязательно равен цене игры . Например, если для первого игрока полезна стратегия Аi, то ей соответствует уравнение: .Кроме этого имеется еще одно уравнение:
.Всего имеем n уравнений для n величин q1, q2, ..., qn.
Игровые методы могут применяться для изучения ситуаций, которые не являются в строгом смысле слова конструктивными. Например, ситуации, где вторым игроком является природа.
1. Понятие имитационного моделирования.
2. Общая постановка задачи имитационного моделирования.
3. Метод Монте-Карло.
До сих пор рассматривались методы решения задач, в которых была известна цель (или несколько целей), достижение которой (которых) считалось желательным. Однако далеко не все ситуации таковы. Особенно ими изобилует современный этап прикладных исследований, когда приходится иметь дело со сложными системами, когда наличествует не только множество целевых функций, но далеко не все ясно с количественным выражением этих функций. В данном случае речь может идти не столько о решении тех или иных задач (хотя это присутствует и здесь), сколько об исследовании поведения сложных систем, о прогнозировании их будущих состояний в зависимости от выбираемых стратегий управления.
Итак, практике потребовался метод для исследования сложных систем, и такой метод появился - это имитационное моделирование ("simulation modeling").
Поскольку для сложных систем многие функции, параметры, характеристики носят случайный характер, то для оценки этих атрибутов, как правило, используется аппарат статистических оценок, а сам метод имитационного моделирования иногда называют методом статистических испытаний. Другими словами, это метод вероятностных оценок, а отсюда, по аналогии с игровыми ситуациями Монте-Карло, его также называют методом Монте-Карло.
Идея метода Монте-Карло чрезвычайно проста и состоит в следующем. Вместо того, чтобы описывать исследуемый процесс (как правило случайный) с помощью аналитического аппарата, производится "розыгрыш" процесса (явления) с помощью какой-либо процедуры, дающей случайный результат. Так же как и в реальности конкретное осуществление (реализация) случайного процесса складывается каждый раз по-разному, также и в результате статистического моделирования (розыгрыша) получаем каждый раз новую, отличную от других, искусственную реализацию процесса. Множество получаемых таким образом реализаций далее обрабатывается как статистический материал, и из него получаются нужные вероятностные характеристики требуемого результата.
При получении множества реализаций мы пользуемся случайностью как аппаратом исследования, заставляя случайность работать на себя.
Метод имитационного моделирования, как правило, используется для анализа функционирования сложных систем, когда возникают непреодолимые сложности при попытке построить "строгую" математическую модель изучаемого объекта, содержащего много связей между элементами, разнообразные нелинейные ограничения, огромное количество параметров и т.п. Иногда можно построить такую модель, но использовать ее из-за отсутствия математического аппарата не представляется возможным. В некоторых случаях для исследуемой системы не существует стройной теории, объясняющей все аспекты ее функционирования, а, следовательно, представляется затруднительным формулирование тех или иных правдоподобных гипотез ее поведения.
Далее, реальные системы, как правило, подвержены влиянию различных случайных факторов, учет которых аналитическим путем представляет порой непреодолимые трудности.
С другой стороны, использование математического аппарата дает возможность сопоставить модель и оригинал только в начале и после применения соответствующего аппарата, что затрудняет верификацию модели.
В основе метода имитационного моделирования лежит возможность максимального использования всей имеющейся в распоряжении исследователя информации о системе с тем, чтобы получить возможность преодолеть аналитические трудности и найти ответы на поставленные вопросы о поведении системы.