Смекни!
smekni.com

Теория игр (стр. 5 из 13)

Данный ответ означает следующее:

если первый игрок с вероятностью 7/8 будет применять первую стратегию, с вероятностью 1/8 четвертую и не будет использовать вторую и третью стратегии, то при достаточно большом количестве игр с данной матрицей его выигрыш в среднем составит не менее 27/8;

если второй игрок с вероятностью 3/8 будет применять первую стратегию и с вероятностью 5/8 вторую, то при достаточно большом количестве игр с данной матрицей его проигрыш в среднем составит не более 27/8.

1.5 Сведение матричной игры к задачелинейного программирования

Теория игр находится в тесной связи с линейным программированием, так как каждая конечная игра двух лиц с нулевой суммой может быть представлена как задача линейного программирования и решена симплексным методом и, наоборот, каждая задача линейного программирования может быть представлена как конечная игра двух лиц с нулевой суммой. Рассмотрим игру двух лиц с нулевой суммой, заданную платежной матрицей

.

Если платежная матрица не имеет седловой точки, т.е. a <b и

, то решение игры представлено в смешанных стратегиях
(x1, x2,..., xm) и
(y1, y2,..., yn). Применение первым игроком оптимальной стратегии
опт
должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры.

,
.


Рассмотрим задачу отыскания оптимальной стратегии игрока А, для которой имеют место ограничения

Величина v неизвестна, однако можно считать, что цена игры v> 0. Последнее условие выполняется всегда, если все элементы платежной матрицы неотрицательны, а этого можно достигнуть, прибавив ко всем элементам матрицы некоторое положительное число.

Преобразуем систему ограничений, разделив все члены неравенств на v.

(1)

где

,
. (2)

По условию x1 + x2 + … +xm = 1.

Разделим обе части этого равенства на v.

.

Оптимальная стратегия

(x1, x2,..., xm) игрока А должна максимизировать величину v, следовательно, функция


(3)

должна принимать минимальное значение.

Таким образом, получена задача линейного программирования: найти минимум целевой функции (3) при ограничениях (1), причем на переменные наложено условие неотрицательности (2). Решая ее, находим значения

,
и величину1/v, затем отыскиваются значения xi = vti.

Аналогично для второго игрока оптимальная стратегия

опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры.

,
.

Рассмотрим задачу отыскания оптимальной стратегии игрока B, для которой имеют место ограничения

Преобразуем систему ограничений, разделив все члены неравенств на v.

(4) где
,
. (5)


По условию y1 + y2 + … +yn = 1. Разделим обе части этого равенства на v.

.

Оптимальная стратегия

(y1, y2,..., yn) игрока В должна минимизировать величину v, следовательно, функция

(6)

должна принимать максимальное значение.

Получена задача линейного программирования: найти максимум целевой функции (6) при ограничениях (4), причем на переменные наложено условие неотрицательности (5).

Таким образом, для нахождения решения игры имеем симметричную пару двойственных задач линейного программирования. Можно найти решение одной из них, а решение второй находится с использованием теории двойственности.

Пример. Найти решение игры, заданной матрицей

.

a = max (2, 3,1) = 3, b = min (4, 5, 6,5) = 4, a¹b,

.

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий.

Для определения оптимальной стратегии игрока А имеем следующую задачу линейного программирования:

,

,
.

Для нахождения оптимальной стратегии игрока В имеем следующую задачу линейного программирования:

,

,
.

Оптимальные решения пары двойственных задач имеют вид

,
,
.

Учитывая соотношения между xi и ti, yjи sj, а также равенство

,

можно найти оптимальные стратегии игроков и цену игры:

(1/2, 1/2, 0),
(3/4, 0, 0, 1/4), v=7/2.

1.6 Игры с природой

В рассмотренных выше матричных играх предполагалось, что в них принимают участие два игрока, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако в некоторых задачах, приводящихся к игровым, имеется неопределенность, вызванная отсутствием информации об условиях, в которых осуществляется действие (погода, покупательский спрос и т.д.). Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности. Такие игры называются играми с природой. Человек в играх с природой старается действовать осмотрительно, второй игрок (природа, покупательский спрос) действует случайно.

Условия игры задаются матрицей

.

Пусть игрок Аимеет стратегии А1, А2, …, Аm, а природа - состояния В1, В2, …, Вn. Наиболее простой является ситуация, когда известна вероятность pjкаждого состояния природы Вj. При этом, если учтены все возможные состояния, p1 + p2 + … + pj+ … +pn= 1.

Если игрок Авыбирает чистую стратегию Аi,то математическое ожидание выигрыша составитp1 ai1 + p2 ai2 + … + pnain. Наиболее выгодной будет та стратегия, при которой достигается

(p1 ai1 + p2 ai2 + … + pnain).