Смекни!
smekni.com

Матричные антагонистические игры с нулевой суммой в чистых стратегиях (стр. 7 из 16)

1.4 Матричные игры

В этом параграфе будет рассказано о принципе максимина, рациональном представлении матрицы игры, о решении игры при помощи фиктивного разыгрывания.

н/ч ч
н/ч 1 -1
ч -1 1

Начнём непосредственно с матричных игр. Тройка

(где xи y– множества, H– функция от двух переменных
) называется антагонистической игрой. Процесс разыгрывания конечной антагонистической игры (игра называется конечной, если тройка
конечна) состоит в том, что игроки 1 и 2 независимо друг от друга выбирают соответственно некоторые чистые стратегии xи y, в результате чего складывается ситуация (x,y).

Мы знаем, что антагонистическую игру двух участников с нулевой суммой (напомним, что нулевая сумма – это когда выигрыш одного игрока равен проигрышу другого) удобно задавать с помощью, так называемой платёжной матрицы. Каждый элемент такой матрицы

содержит числовое значение выигрыша игрока 1 (или проигрыша игрока 2) в ситуации, когда первый игрок применяет стратегию i, а второй – стратегию j. Классическим примером антагонистической игры является игра с двумя участниками, которые независимо друг от друга загадывают числа. Предполагается, что если сумма оказывается чётной, то выигрыш равный 1, достаётся первому игроку, а если нечётной, то второму. Если предположить, что загадывание нечётного числа – стратегия первого игрока, а загадывание чётного числа – стратегия второго игрока, то платёжная матрица выглядит следующим образом:

Строки матрицы соответствуют стратегиям игрока 1, столбцы – стратегиям игрока 2, а её элементы – результатам (т.е. выигрышам) первого. Если взять элементы матрицы с обратным знаком, то это будут выигрыши второго игрока. Здесь надо отметить, что вопрос о выборе стратегии является основным в теории игр. Для примера проанализируем произвольную игру

. При выборе игроком 1 стратегии i, его выигрыш в независимости от игрока 2 составит
. Стратегия Iпроизвольно, поэтому главная цель игрока 1 максимизировать величину полученного выигрыша, т.е. получить
. Такой принцип получил название принципа максимина. Напомним, что максимин – это выигрыш максимальный из минимальных. Надо также отметить, что принцип максимина обеспечивает игрокам гарантированный «выигрыш» при любых стратегиях противников.

Теорема о принципе максимина.

Для

с
(где
- множества чистых стратегий игроков, (х, у) – ситуация игры
- функции полезности игроков, заданные на множестве ситуаций
игры аналитически
) общего вида

.

Доказательство.

Для


Для игры, заданной матрицей выигрышей

можно записать следующее равенство
.

Скажем ещё несколько слов о матричных играх. Для матричных игр доказано, что любая из них имеет решение, и оно может быть легко найдено путем сведения игры к задаче линейного программирования.

Матричная игра игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков.

Первый игрок имеет mстрате6гий i= 1,2,...m, второй имеет nстратегий j=1,2,...n. Каждой паре стратегий (i, j) поставлено в соответствии число a

, выражающее выигрыш игрока 1 за счет игрока 2, если первый игрок примет свою i-ю стратегию, а 2-ю j-ю стратегию.

Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=

), 2- свою j-ю стратегию (j=
) после чего игрок 1 получает выигрыш a
за счет игрока 2 ( если a
<0, то это значит, что игрок 1 платит второму сумму
a
). На этом игра заканчивается.

Каждая стратегия игрока i=

; j=
часто называется чистой стратегией.

Если рассмотреть матрицу


то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i- строки, а игроком 2 j-го столбца и получения игроком 1 (за счет игрока 2) выигрыша a

.

Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие вкладывается следующий смысл: обеспечивается наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i(i=

) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2

mina

(i=
)

j

т.е определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i=i

, при которой этот минимальный выигрыш будет максимальным, т.е. находится

maxmina

= a
=
(1)

Определение: Число

, определенное по формуле (1) называется чистой нижнейценойигрыпоказывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.

Игрок 2 при оптимальном своем поведении должен стремиться по возможности за счет своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается


maxa

i

т.е. определяется maxвыигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает свою j=j

стратегию, при которой игрок 1 получит minвыигрыш, т.е. находит

min max a

=a
=
(2)