Формализация. Первый игрок имеет две чистые стратегии: покупать и не покупать специализированное ремонтное оборудование. У природы - второго игрока - четыре состояния: станок не выйдет из строя, выйдет один раз, сломается два раза и три раза. Функция выигрыша - затраты фирмы на покупку и ремонт станка, задается платежной матрицей:
|   Выход станка из строя  |  |||||
|   Ремонтное оборудование  |    ни разу  |    1 раз  |    2 раза  |    3 раза  |  |
|   не купить  |    -100  |    -140  |    -180  |    -220  |  |
|   купить  |    -150  |    -160  |    -170  |    -180  |  |
Решение. Рассмотрим сначала эту задачу как антагонистическую игру.
В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = ( 0, 1 ), y* = ( 0, 0, 0, 1 ), v* = - 180 ден.ед.
Ответ: нужно купить специализированное оборудование.
Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.
Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .
Таким образом, первому игроку выгодно играть неоптимально !
Ответ: не покупать специализированное оборудование.
Существенное различие между значениями v(x*) и v(x') обьясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден.единиц выигрыша.
2. Игры с природой в условиях неопределенности.
Если распределение вероятностей будущих состояний природы не известно, вся информация о природе сводится к перечню ее возможных состояний.
Пример. Игра "Поставщик".
Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.
Какой стратегии должен придерживаться завод в сложившейся ситуации?
Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транстпорт, 3) послать к поставщику представителя и транстпорт, 4) купить и привезти материал-заменитель от другого поставщика.
Составим таблицу расчетов:
|   Затраты и убытки фирмы-изготовителя  |  ||||||
|   Ситуация  |    Стоимость материала  |    Недовыпуск продукции  |    Транспорт  |    Команди-ровочные расходы  |    Издержки хранения  |    Общая сумма  |  
|   1 1  |    - 100  |    0  |    0  |    0  |    0  |    - 100  |  
|   1 2  |    0  |    - 400  |    0  |    0  |    0  |    - 400  |  
|   2 1  |    - 100  |    0  |    - 50  |    0  |    0  |    - 150  |  
|   2 2  |    - 50  |    - 200  |    - 50  |    0  |    0  |    - 300  |  
|   3 1  |    - 100  |    0  |    - 50  |    - 50  |    0  |    - 200  |  
|   3 2  |    - 80  |    - 80  |    - 50  |    - 50  |    0  |    - 260  |  
|   4 1  |    - 250  |    0  |    - 50  |    0  |    - 30  |    - 330  |  
|   4 2  |    - 150  |    0  |    - 50  |    0  |    0  |    - 200  |  
Решение. На основе полученных результатов вычислений можно составить платежную матрицу:
|   min  |    max  |  ||
|   - 100  |    - 400  |    - 400  |  |
|   - 150  |    - 300  |    - 300  |  |
|   - 200  |    - 260  |    - 260  |    - 260  |  
|   - 330  |    - 200  |    - 330  |  
Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транстпорт.
1. Рассмотренный способ поиска оптимального решения называется критерием Вальда (Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:
vW = maxi minj aij = -260 ед.
Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.
2. Максимаксный критерий. Самый благоприятный случай:
vM = maximaxj aij = -100 ед.
Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.
3. Критерий пессимизма-оптимизма Гурвица.
Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:
vH = maxi [a maxi aij + (1-a) minj aij ], где a - “степень оптимизма” , 0£ a £1.
При a = 0 критерий Гурвица тождественен критерию Вальда, а при a =1 совпадает с максиминным решением.
На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма a ближе к нулю.
Влияние степени оптимизма на выбор решения в задаче “Поставщик”.
|   Степень оптимизма  |  ||||||||||
|   Решение  |    0,1  |    0,2  |    0,3  |    0,4  |    0,5  |    0,6  |    0,7  |    0,8  |    0,9  |  |
|   А1  |    1 стратегия  |    -370  |    -340  |    -310  |    -280  |    -250  |    -220  |    -190*  |    -160*  |    -130*  |  
|   А2  |    2 стратегия  |    -285  |    -270  |    -255  |    -240  |    -225*  |    -210*  |    -195  |    -180  |    -165  |  
|   А3  |    3 стратегия  |    -254*  |    -248*  |    -242*  |    -236*  |    -230  |    -224  |    -218  |    -212  |    -206  |  
|   А4  |    4 стратегия  |    -317  |    -304  |    -281  |    -278  |    -265  |    -252  |    -239  |    -226  |    -213  |  
Величина vH для каждого значения a отмечена*. При a £ 4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9£ a £2/3 - решение А2. В остальных случаях А1. А4 не выгодно во всех случаях.