Смекни!
smekni.com

О некоторой общей схеме формирования критериев оптимальности в играх с природой (стр. 3 из 4)

Относительно критериев 7 и 8 имеет место следующее.

Утверждение 3. Все четыре критерия 7.1, 7.2, 8.1, 8.2 эквивалентны между собой:

7.1  7.2  8.1  8.2. (13)

Доказательство. Рассмотрим, например, критерии 7.1 и 8.2. Показатели оптимальности в критерии 7.1 и неоптимальности в критерии 8.2 стратегий соответственно равны

и

Складывая

с
и используя при этом определение риска (2), получим

(14)

где

– взвешенное среднее максимальных выигрышей при каждом состоянии природы Пj. Из (14) имеем:

.

Аналогичным образом можно получить выражение Ki через Li для других пар критериев 7.1 и 8.1, 7.2 и 8.2. Полученные выражения представлены в табл. 2.

Таблица 2

Критерии Критерии 8.1 8.2
Показатели неоптимальностистратегийкритерия 8
Показателиоптимальностистратегий критерия 7
7.1
7.2

Из этой таблицы очевидно, что поскольку

для данной матрицы выигрышей (aij) есть величина постоянная, то показатель неоптимальности Ki в каждой клетке обращается в минимум при том же значении i, при котором показатель оптимальности Li обращается в максимум. Следовательно, имеем следующие эквиваленции критериев:

7.1  8.1, 7.1  8.2, 7.2  8.1, 7.2  8.2, из которыx следует требуемая экиваленция (13).

Отметим, что эквиваленция 7.1  8.1 – известный факт (доказанный, например, в [1], с. 502).

Из эквиваленции (13) можно сделать вывод о том, что из критериев 7.1, 7.2, 8.1, 8.2 достаточно применить один, причем с более простой функцией игры.

 Максиминно-максимаксные критерии.

Такие критерии представляют собой комбинации максиминного и максимаксного критериев. В качестве показателя оптимальности стратегии

берется величина

где   [0,1]– коэффициент оптимизма, а

и
– показатели оптимальности стратегии Ai соответственно в максиминном и максимаксном критериях (см. п. 3 и п. 5). При этом функции игры в этих двух критериях целесообразно использовать соответствующие друг другу. Это соответствие показано в табл. 3.

Таблица 3

Критерии Выигрышиa Рискиr Вероятностисостояний природыq W (a, r, q) M (a, r, q)
9.1 + a a
9.2 + + (1-q)a qa
9.3 + + a-r a-r
9.4 + + + (1-q)a-qr qa-(1-q)r

Оптимальной считается стратегия Ai0, максимизирующая показатель оптимальности Нi( ):

Коэффициент оптимизма  выбирается субъективно в пределах от 0 до 1, включая концы, в зависимости от опасности ситуации: чем более опасной представляется ситуация, тем меньше оптимизма и тем меньше коэффициент оптимизма  ; чем более благоприятная ситуация, тем больше оптимизма и значит  можно выбирать ближе к 1.

При наименьшем значении коэффициента оптимизма  = 0 данный критерий превращается в максиминный критерий крайнего пессимизма, а при наибольшем значении коэффициента оптимизма  = 1 рассматриваемый критерий превращается в максимаксный критерий крайнего оптимизма. При  = 1/2 максиминно-максимаксный критерий можно считать критерием реализма.

Критерий 9.1 является критерием Гурвица относительно выигрышей ([1], с. 505; [2], с. 120; [3], с. 47; [5], с. 57).

 Минимаксно-миниминные критерии.

Минимаксно-миниминные критерии являются результатом комбинации минимаксного и миниминного критериев. Показатель неоптимальности стратегии Ai определяется следующим образом:

где   [0,1]– коэффициент оптимизма, а

и
– показатели неоптимальности стратегии Ai соответственно в минимаксном и миниминном критериях (см. п. 4 и п. 6). Функции игры в этих двух критериях лучше выбирать соответствующими друг другу, как это указано в табл. 4.

Таблица 4

Критерии Выигрышиa Рискиr Вероятностисостояний природыq S (a, r, q) M (a, r, q)
10.1 + r r
10.2 + + qr (1-q)r
10.3 + + r-a r-a
10.4 + + + qr-(1-q)a (1-q)r-qa

Оптимальной по критерию является стратегия Ai0, для которой

.

Данный критерий превращается в минимаксный критерий при  = 0, в миниминный критерий при  = 1, в критерии Гурвица относительно рисков при

(критерий 10.1).

Утверждение 4. При одном и том же коэффициенте оптимизма

максиминно-максимаксные критерии 9.3 и 9.4 эквиваленты соответственно минимаксно-миниминным критериям 10.3 и 10.4.

Доказательство. Для критериев 10.3 и 9.3 имеем:

откуда

т.е. показатель неоптимальности Di( ) будет минимальным для того значения i, для которого показатель оптимальности Hi( ) будет максимален. Таким образом, эквиваленция 9.3  10.3 доказана.

Эквиваленция 9.4  10.4 доказывается аналогично. n

ПРИМЕР. Рассмотрим игру с природой, в которой игрок А имеет возможность применить одну из четырех стратегий А1, А2, А3, А4, а природа П может находиться в одном из трех состояний П1, П2, П3 с вероятностями соответственно q1 = 0,7; q2 = 0,1; q3 = 0,2. Известны выигрыши (aij) игрока А. Найдем оптимальные стратегии по рассмотренным выше критериям.

Выпишем таблицы показателей игры и в дополнительных столбцах – показатели оптимальности и неоптимальности для соответствующих критериев. При этом на основании утверждений 1-4 из эквивалентных критериев будем рассматривать только один.

Таблица для критериев 3.1 и 5.1 Таблица для критерия 3.2
ПjAi П1 П2 П3 Wi Mi ПjAi П1 П2 П3 Wi
A1 4 7 1 1 7* A1 1,2 6,3 0,8 0,8
(aij) = A2 4 3 5 3* 5
A2 1,2 2,7 4,0 1,2
A3 6 5 2 2 6 A3 1,8 4,5 1,6 1,6*
A4 0 6 3 0 6 A4 0,0 5,4 2,4 0,0

Таблица для критериев 4.1 и 6.1 Таблица для критерия 4.2

ПjAi П1 П2 П3 Si Ei ПjAi П1 П2 П3 Si
A1 2 0 4 4 0* A1 1,4 0,0 0,8 1,4
(rij) = A2 2 4 0 4 0* (qjrij) = A2 1,4 0,4 0,0 1,4
A3 0 2 3 3* 0* A3 0,0 0,2 0,6 0,6*
A4 6 1 2 6 1 A4 4,2 0,1 0,4 4,2

Таблица для критерия 3.3 и 5.3 Таблица для критерия 3.4

ПjAi П1 П2 П3 Wi Mi ПjAi П1 П2 П3 Wi
A1 2 7 -3 -3 7* A1 -0,2 6,3 0,0 -0,2
(аij–rij)= A2 2 -1 5 -1* 5 ((1-qj )аij– qjrij)= A2 -0,2 2,3 4,0 -0,2
A3 6 3 -1 -1* 6 A3 1,8 4,3 1,0 1,0*
A4 -6 5 1 -6 5 A4 -4,2 5,3 2,0 -4,2

Таблица для критерия 5.2 и 7.1 Таблица для критерия 6.2

ПjAi П1 П2 П3 Mi Li ПjAi П1 П2 П3 Ei
A1 2,8 0,7 0,2 2,8 3,7 A1 0,6 0,0 3,2 0,0*
(qj аij) = A2 2,8 0,3 1,0 2,8 4,1 ((1-qj)rij) = A2 0,6 3,6 0,0 0,0*
A3 4,2 0,5 0,4 4,2* 5,1* A3 0,0 1,8 2,4 0,0*
A4 0,0 0,6 0,6 0,6 1,2 A4 1,8 0,9 1,6 0,9

Таблица для критерия 5.4