Существует много классов игр, различающихся по количеству игроков, числу ходов, характеру функций выигрыша и т.д. Выделим следующие основные классы игр:
· антагонистические (игры со строгим соперничеством) и неантогонистические. В первом случае цели игроков противоположны, во - втором - могут совпадать;
Наибольшее распространение в технических приложениях имеют парные стратегические бескоалиционные конечные некооперативные игры. Модель проблемной ситуации в этом случае имеет вид:
< U, V, W1, W2, R1, R2 >,
где
U - множество стратегий оперирующей стороны (конструктора);
V - множество стратегий оппонирующей стороны (технолог и природа);
W1 и W2 - показатели качества игроков;
R1 и R2 - системы предпочтения игроков.
Системы предпочтения игроков, в свою очередь, основываются на двух ведущих принципах рационального поведения: принципе наибольшего гарантированного результата и принципе равновесия.
Первый основан на том, что рациональным выбором одного из игроков должен считаться такой, при котором он рассчитывает на самую неблагоприятную для него реакцию со стороны другого игрока.
Второй принцип гласит, что рациональным выбором любого игрока считается такая стратегия u$ (или v$), для которой ситуация (u$, v$) обоюдовыгодна: любое отклонение от данной ситуации игры не является выгодным ни для одного из игроков.
Решается парная матричная игра (проектируемое изделие - меры и средства противодействия) с нулевой суммой (выигрыш одной стороны равен проигрышу другой) на основе рассмотрения платежной матрицы, которая представляет собой совокупность значений U и V (пара стратегий (u,v) U x V называется ситуацией игры) а также выигрышей Wij при парном сочетании всевозможных стратегий сторон.
Решение парной матричной игры может быть в чистых стратегиях, когда для каждой из сторон может быть определена единственная оптимальная стратегия, отклонение от которой невыгодно обоим игрокам. Если выгодно использовать несколько стратегий с определенной частотой их чередования, то решение находится в смешанных стратегиях.
Основные особенности использования методов теории заключаются в следующем. В качестве возможных стратегий со стороны проектируемой системы рассматриваются возможные варианты ее строения, из которых следует выбрать наиболее рациональный. В качестве стратегий противника рассматриваются возможные варианты его противодействия, стратегии их применения.
Необходимо отметить, что при рассмотрении игр с использованием адаптивной системы число ее стратегий может быть существенно расширено благодаря реализации "гибких" конструкторских решений. Анализ игровых ситуаций в этом случае может быть направлен не только на выбор рационального варианта проектируемого изделия, но и на определение алгоритмов рационального применения системы в конфликтной ситуации.
Другая особенность применения методов теории игр заключается в выборе решений, получаемых на основе анализа конфликтной ситуации. В теории игр доказывается теорема о том, что оптимальная стратегия для каждого из игроков является оптимальной и для другого. Так, если решение игры получено в чистых стратегиях (имеется седловая точка), то выбор решения однозначен. Например, если для парной антагонистической игры 3x4 составить матрицу, где элементами uij будут выигрыши (проигрыши) игроков, то седловая точка находится на пересечении максимина строк и минимакса столбцов
Стратегии | Стратегии B | Min | |||
A | 1 | 2 | 3 | 4 | строк |
1 | 8 | 2 | 9 | 5 | 2 |
2 | 6 | 5 | 7 | 18 | 5 |
3 | 7 | 3 | -4 | 10 | -4 |
max столбцов | 8 | 5 | 9 | 18 |
Оптимальными стратегиями будут для A - 2, для B - 2. Цена игры равна 5. Отметим, что в случае наличия седловой точки ни один из игроков не может улучшить стратегию и стратегии называются чистыми. Отметим, что игра с чистыми стратегиями может существовать только при наличии полной информации о действиях противника.
Если же решение игры получено в смешанных стратегиях, то это эквивалентно созданию множества вариантов проектируемого компонента и использованию их с оптимальными частотам, соответствующими оптимальной смешанной стратегии. В случаях, когда не имеется полной информации о действиях противника, вводятся вероятности применения той или иной стратегии в виде векторов
P<n>=<p1, p2, ..., pn> - для игрока A, где
;Q<m>=<q1, q2, ..., qn> - для игрока B, где
.При этом игрок A выбирает стратегию в соответствии с принципом максимина по выражению:
,а игра B по принципу минимакса
.Рассмотрим пример: пусть рассматривается принятие решения в игре 2x2, где игрок A знает вероятность стратегии 1, то есть p1, тогда очевидно вероятность стратегии 2 будет 1-p, соответственно стратегии игрока B будут q1 и 1-q1. Платежная матрица будет иметь вид:
B | |||
q1 | 1-q1 | ||
A | p1 | a11 | a12 |
1-p1 | a21 | a22 |
На основании матрицы и приведенных выше выражений составляется таблица:
Чистые стратегии игрока B | Ожидаемые выигрыши игрока A |
1 | (a11-a21)p1 + a21 |
2 | (a12-a22)p1 + a22 |
Из таблицы видно, что ожидаемый выигрыш игрока A линейно зависит от вероятности p1 (в данном случае задача может быть решена графоаналитически). Тогда смешанная стратегия игрока А будет иметь вид
<p*1, p*2>,
то есть игроку A выгодно применять стратегию 1 с частотой (вероятностью) - p1, а стратегию 2 с частотой p2.
Очевидно, что разработка нескольких вариантов изделия сопряжена с большими затратами, не всегда реализуема и затрудняет использование системы. Поэтому при получении решения в смешанных стратегиях рекомендуются следующие случаи принятия окончательного решения:
· для дальнейшего проектирования выбирается тот вариант, который гарантирует максимальное качество (выбор по максиминной стратегии аналогично критерию Вальда);
Важное значение в задачах исследования качества адаптивных систем имеет не только решение игры, но и анализ платежной матрицы. Это особенно важно в тех случаях, когда решение в смешанных стратегиях не реализуется. Этот анализ может проводиться на основе: оценки возможных потерь эффективности в случае реализации чистой стратегии; определения дополнительных затрат на их компенсацию с помощью "гибких" конструкторских решений; оценки достоверности рассмотренных стратегий противодействия; определения возможности реализации компромиссных вариантов и т.д.
Для анализа конфликтной ситуации требуется на основе математической модели операции построить платежную матрицу [Wmn] =[Wij], где Wij характеризует качество изделия при выборе i-го варианта проектируемого изделия и при j-м варианте противодействия противника.
Решение может быть получено в чистых стратегиях, когда есть седловая точка. Условие седловой точки имеет вид
, (1.21)где левая часть выражения - нижняя цена игры, правая - верхняя цена игры.
Если условие (1.8) не выполняется, то седловая точка отсутствует и требуется реализация смешанной стратегии.