1.4 Матричные игры
В этом параграфе будет рассказано о принципе максимина, рациональном представлении матрицы игры, о решении игры при помощи фиктивного разыгрывания.
н/ч | ч | |
н/ч | 1 | -1 |
ч | -1 | 1 |
Начнём непосредственно с матричных игр. Тройка
(где xи y– множества, H– функция от двух переменных ) называется антагонистической игрой. Процесс разыгрывания конечной антагонистической игры (игра называется конечной, если тройка конечна) состоит в том, что игроки 1 и 2 независимо друг от друга выбирают соответственно некоторые чистые стратегии xи y, в результате чего складывается ситуация (x,y).Мы знаем, что антагонистическую игру двух участников с нулевой суммой (напомним, что нулевая сумма – это когда выигрыш одного игрока равен проигрышу другого) удобно задавать с помощью, так называемой платёжной матрицы. Каждый элемент такой матрицы
содержит числовое значение выигрыша игрока 1 (или проигрыша игрока 2) в ситуации, когда первый игрок применяет стратегию i, а второй – стратегию j. Классическим примером антагонистической игры является игра с двумя участниками, которые независимо друг от друга загадывают числа. Предполагается, что если сумма оказывается чётной, то выигрыш равный 1, достаётся первому игроку, а если нечётной, то второму. Если предположить, что загадывание нечётного числа – стратегия первого игрока, а загадывание чётного числа – стратегия второго игрока, то платёжная матрица выглядит следующим образом:Строки матрицы соответствуют стратегиям игрока 1, столбцы – стратегиям игрока 2, а её элементы – результатам (т.е. выигрышам) первого. Если взять элементы матрицы с обратным знаком, то это будут выигрыши второго игрока. Здесь надо отметить, что вопрос о выборе стратегии является основным в теории игр. Для примера проанализируем произвольную игру
. При выборе игроком 1 стратегии i, его выигрыш в независимости от игрока 2 составит . Стратегия Iпроизвольно, поэтому главная цель игрока 1 максимизировать величину полученного выигрыша, т.е. получить . Такой принцип получил название принципа максимина. Напомним, что максимин – это выигрыш максимальный из минимальных. Надо также отметить, что принцип максимина обеспечивает игрокам гарантированный «выигрыш» при любых стратегиях противников.Теорема о принципе максимина.
Для
с (где - множества чистых стратегий игроков, (х, у) – ситуация игры - функции полезности игроков, заданные на множестве ситуаций игры аналитически ) общего вида .Доказательство.
Для
Для игры, заданной матрицей выигрышей
можно записать следующее равенство .Скажем ещё несколько слов о матричных играх. Для матричных игр доказано, что любая из них имеет решение, и оно может быть легко найдено путем сведения игры к задаче линейного программирования.
Матричная игра игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков.
Первый игрок имеет mстрате6гий i= 1,2,...m, второй имеет nстратегий j=1,2,...n. Каждой паре стратегий (i, j) поставлено в соответствии число a
, выражающее выигрыш игрока 1 за счет игрока 2, если первый игрок примет свою i-ю стратегию, а 2-ю j-ю стратегию.Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=
), 2- свою j-ю стратегию (j= ) после чего игрок 1 получает выигрыш a за счет игрока 2 ( если a <0, то это значит, что игрок 1 платит второму сумму a ). На этом игра заканчивается.Каждая стратегия игрока i=
; j= часто называется чистой стратегией.Если рассмотреть матрицу
то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i- строки, а игроком 2 j-го столбца и получения игроком 1 (за счет игрока 2) выигрыша a
.Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие вкладывается следующий смысл: обеспечивается наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i(i=
) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2mina
(i= )j
т.е определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i=i
, при которой этот минимальный выигрыш будет максимальным, т.е. находитсяmaxmina
= a = (1)Определение: Число , определенное по формуле (1) называется чистой нижнейценойигрыпоказывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.
Игрок 2 при оптимальном своем поведении должен стремиться по возможности за счет своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается
maxa
i
т.е. определяется maxвыигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает свою j=j
стратегию, при которой игрок 1 получит minвыигрыш, т.е. находитmin max a
=a = (2)