Смекни!
smekni.com

Математические методы исследования операций в экономике (стр. 34 из 37)

6.1.3. Матричные игры и понятие седловой точки. Рас­смотрим более подробно антагонистические игры и их основ­ные свойства. Удобным способом задания игры двух участников с нулевой суммой является платежная матрица. Отсюда, кстати, происходит еще одно их название — матричные игры. Каждый элемент платежной матрицы аij содержит числовое значение выигрыша игрока I (проигрыша игрока II), если пер­вый применяет стратегию i, а второй — стратегию j. Термины выигрыш и проигрыш следует понимать в широком смысле, т. к. они могут принимать отрицательные значения и с житейской точки зрения означать противоположное. Нетривиальность за­дачи прежде всего заключается в том, что каждый из игроков делает свой выбор, не зная о выборе другого, что существенно осложняет процесс оптимизации выбираемой стратегии.

Классическим примером антагонистической игры является игра с двумя участниками, загадывающими независимо друг отдруга числа. Предполагается, что если их сумма оказывается чет­ной, то выигрыш, равный 1, достается первому игроку, а если не­четной, то второму. Положив, что для обоих игроков загадыва­ние нечетного числа является первой стратегией, а четного — второй, можем записать платежную матрицу данной игры:

Строки матрицы (6.1) соответствуют стратегиям игрока I, столб­цы — стратегиям игрока II, а ее элементы — результатам перво­го игрока. Также из определения игры следует, что элементы данной матрицы, взятые с обратным знаком, соответствуют вы­игрышам второго игрока.

Более сложная и содержательная платежная матрица может быть получена, если несколько модифицировать предложен­ную игру. Допустим, что оба участника имеют право загадывать числа от 1 до 4, что составляет их соответствующие стратегии. В случае, если результат сложения задуманных чисел будет четным, то второй игрок выплачивает первому получившуюся сумму, а если нечетным, то первый — второму. Запишем пла­тежную матрицу для такой игры:

Некоторая условность и искусственность в постановке про­блемы не должны в данном случае нас смущать, так как к подоб­ной форме может быть сведена модель, описывающая, напри­мер, соревнование двух фирм за вновь открывшийся рынок сбыта продукции и т. п.

Как уже отмечалось, важнейшим в теории игр является во­прос об оптимальности решения (выбора стратегии) для каж­дого из игроков. Проанализируем с этой точки зрения некото­рую матричную игру, для которой задана платежная матрица А=║aijmxn. При выборе игроком I стратегииi его гарантирован­ный доход независимо от действий игрока II составит min ai,j. Поскольку он может выбирать i самостоятельно, то целесооб­разно этот выбор сделать таким, чтобы он при любой стратегии противника максимизировал величину гарантированного дохо­да, т. е. обеспечивал получение max (min ai,j). Такой принцип вы­бора стратегии получил название «принцип максимина». С дру­гой стороны, аналогичные рассуждения могут быть проведены по поводу действий второго игрока. Его наибольший проигрыш при выборе стратегии j составит maxai,j, и, следовательно, ему следует выбирать стратегию так, чтобы минимизировать вели­чину проигрыша при любых действиях соперника, т. е. обеспе­чить min (max ai,j). в этом суть принципа минимакса.

Можно доказать справедливость следующего соотношения:

Однако очевидный интерес представляет ситуация, при ко­торой значение выигрыша (платежа), получаемого игроком I при выборе им максиминной стратегии, равно платежу (проиг­рышу) II-го игрока при минимаксной стратегии

В этом случае говорят, что игра имеет седловую точку. Совпа­дение значений гарантированных выигрышей игроков при мак­симинной и минимаксной стратегии означает возможность до­стижения в игре некоторого оптимального (стабильного, равновесного) состояния, от которого невыгодно отклоняться ни одному из участников. Понятие «оптимальность» здесь озна­чает, что ни один разумный (осторожный) игрок не стремится изменить свою стратегию, так как его противник, в принципе, сможет выбрать такую стратегию, которая даст худший для первого результат. Стратегии i* и j*, образующие седловую точку, называются оптимальными, а значениеv = ai*j* называют це­ной игры. Тройка (i*, j*, v) считается решением матричной игры с седловой точкой.

Нетрудно заметить, что не всякая игра обладает седловой точкой. В частности, как игра (6.1), так и игра (6.2) седловой точки не имеют. Примером игры, имеющей седловую точку, яв­ляется игра с платежной матрицей (6.5).

В данной матрице минимальные (гарантированные) выигрыши первого игрока по строкам равны 1, 5 и (-3). Следовательно, его максиминному выбору будет отвечать стратегия 2, гаранти­рующая выигрыш 5. Для второго игрока максимальные проиг­рыши по столбцам матрицы составят 8, 10, 5, 17, поэтому имеет смысл остановиться на стратегии 3, при которой он проиграет только 5. Таким образом, вторая стратегия первого игрока и третья стратегия второго образуют седловую точку со значени­ем 5, т. е. для игры с матрицей (6.5) имеет решение (2; 3; 5).

6.1.4. Смешанные стратегии. Дальнейшее развитие тео­рии матричных игр основывается на исследовании игры как не­которого повторяющегося процесса. Действительно, вряд ли можно дать содержательные рекомендации по такому вопросу, как следует поступать участникам однократно проводимой игры, не имеющей седловой точки. В случае же ее многократных по­второв естественной и плодотворной представляется идея ран­домизации выбора стратегий игроками, т. е. внесение в процесс выбора элемента случайности. Действительно, систематическое отклонение, например, игрока I от максиминной стратегии с це­лью увеличения выигрыша может быть зафиксировано вторым игроком и наказано. В то же время абсолютно хаотичный выбор стратегий не принесет в среднем наилучшего результата.

- Смешанной стратегиейигрока I в игре с матрицей A=║ai,jmxn называется упорядоченный набор действительных чисел xi , i∊1:m, удовлетворяющих условиям

Числа интерпретируются как вероятности применения иг­роком I стратегий 1, 2,..., m, которые, в отличие от смешанных, также называют чистыми стратегиями.

Аналогично вводится понятие смешанных стратегий игрока II, которые определяются как набор чисел уj, j∊1:n , удовлетво­ряющих условиям

Тогда, если игрок I применяет смешанную стратегию х=(х1, х2,..., хm) а игрок II смешанную стратегию y=(y1, y2,..., yn), то математическое ожидание выигрыша игрока I (проигрыша игрока II) определяется соотношением

*

* Напомним, что при многократном повторении игры средний выиг­рыш близок к математическому ожиданию.

В дальнейшем через Х будем обозначать множество допу­стимых смешанных стратегий игрока I, определяемое условием 6.7, а черезY — определяемое условием 6.8 множество допу­стимых смешанных стратегий игрока II.

К поиску решения игры в смешанных стратегиях, так же как и в п. 6.1.3, могут быть применены критерии максимина-минимакса. В соответствии с ними игрок I будет выбирать свою сме­шанную стратегию х=(х1, х2,..., хm) таким образом, чтобы мак­симизировать наименьший средний выигрыш:

который, как можно доказать, равен

а игрок II — свою смешанную стратегию так, чтобы минимизи­ровать наибольший средний проигрыш:

также равный

По аналогии с (6.3) для любых хХ иyY справедливо не­равенство

-Стратегии х*Х иy*Yназываютоптимальными смешанными стратегиями, если для любыххХ иyYсправедливо равенство

v =F(x*,у*) называют ценой игры, и если х* и у* существу­ют, то говорят, что игра имеет решение в смешанных стра­тегиях (х*, у*, v).

Справедлива фундаментальная теорема Дж. Неймана, кото­рую мы приведем без доказательства.

Теорема 6.1 (основная теорема матричных игр). Любая матричная игра имеет решение в смешанных страте­гиях.

Значение и нетривиальность теоремы (6.1) обусловлены прежде всего тем, что, как было показано в п. 6.1.3, в общем случае матричные игры в чистых стратегиях решения не имеют.