Если aij = ωj, то риск rij, является максимальным. Следовательно, по критерию риска стратегия Аi в этом случае наихудшая.
Если βj = ωj, то все выигрыши j-столбце матрицы игры равны между собой: ωj = a1j = a2j = … = amj = βj и риск rij = 0. Поэтому в этом случае любая стратегия игрока А при состоянии природы Пj безрисковая.
Для матрицы А матрица рисков RA имеет ту же размерность и следующий вид:
Таблица 2 – Матрица рисков
RA = | Пj Аi | П1 | П2 | … | Пn |
А1 | r11 | r12 | … | r1n | |
А2 | r21 | r22 | … | r2n | |
… | … | … | … | … | |
Аm | rm1 | rm2 | … | rmn |
Отметим, что матрица выигрышей А однозначно порождает матрицу рисков RA, поскольку каждый риск rij однозначно определяется соответствующими показателем благоприятности βj состояния природы Пj, и выигрышем aij. Обратное неверно: одна и та же матрица рисков может соответствовать разным матрицам выигрышей.
В понятии оптимальной стратегии лежат различные соображения, составляющие содержание соответствующих критериев оптимальности стратегий.
Перед тем как переходить к выбору оптимальной стратегии, целесообразно возможности упростить матрицу А, уменьшив число строк на основании принципа доминирования стратегий игрока А.
Если какая-нибудь из стратегий игрока А окажется доминирующей каждую из остальных его стратегий, то она и должна выбираться игроком А в качестве предпочтительной, поскольку его выигрыш при этой стратегии и при любом состоянии природы П не меньше выигрыша при любой из остальных стратегий.
Если же матрица игры не обладает указанным свойством, т.е. у игрока А нет стратегии, доминирующей каждую из остальных его стратегий, то нужно посмотреть, нет ли у него доминируемых или дублирующих стратегий. При наличии таковых, соответствующие им строки матрицы можно удалить, уменьшив тем самым ее размерность.
Таким образом, в играх с природой можно и полезно пользоваться принципом доминирования стратегий игрока А (строк матрицы игры). Однако принцип доминирования стратегий (состояний) природы (столбцов матрицы игры) недопустим, поскольку природа не выбирает свои состояния с целью по возможности большего уменьшения выигрышей игрока А, для нее нет более или менее эффективных состояний.
Предположим, что статистик из прошлого опыта известны не только состояния Пj, j = l, ..., п, в которых может находиться природа П, но и соответствующие вероятности q1 , ..., qn с которым природа П реализует эти состояния. Тогда мы находимся в ситуации принятия решения в условиях риска.
Показателем эффективности стратегии Аi по критерию Байеса относительно выигрышей называется среднее значение, или математическое ожидание выигрыша i-й строки с учетом вероятностей всех возможных состояний природы. Обозначая это среднее значение через āi, будем иметь:
āi = q1ai1 + q2ai2 + … + qnain = , i=1, …, m. (6)
Таким образом, at представляет собой взвешенное среднее выигрышей i-й строки, взятых с весами q1 , ..., qn.
Оптимальной среди чистых стратегий по критерию Байеса относительно выигрышей считается стратегия Аi0 с максимальным показателем эффективности, т.е. с максимальным средним выигрышем:
āi0 = max āi. (7)
1≤ i ≤m
Таким образом, выбранное решение по этому критерию является оптимальным не в каждом отдельном случае, а в среднем.
Распространим понятие показателя эффективности по критерию Байеса относительно выигрышей на смешанные стратегии игрока П.
Пусть P = ( p1 , ..., pn ) - некоторая смешанная стратегия игрока А, при которой чистая стратегия Аi используется им с вероятностью pi, i=1, ..., т. Тогда выигрыш игрока А при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы Пj будет равен
H (P, Пj) = , j=1, …, n. (8)
Показателем эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей назовем среднее значение выигрышей, с учетом вероятностей q1 , ..., qn состояний природы. Обозначим этот показатель через
.Получим:
= = = = . (9)
Таким образом показатель эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей представляет собой взвешенное среднее показателей эффективности чистых стратегий Аi, i = l, ..., m, по тому же критерию с весами pi, i = l, ..., m.
Если, в частности, стратегия P = ( p1 , ..., pn ) является чистой стратегией Аk, k = l, ..., m, то pi = 0 i ≠ k, pk = 1, и ее показатель эффективности как смешанной стратегии
, превращается в ее показатель эффективности как чистой стратегии āk, вычисляемый по формуле (6).Пусть SA - множество всех смешанных (в том числе и чистых) стратегий игрока A. Оптимальной среди всех стратегий множества SA по критерию Байеса относительно выигрышей назовем стратегию P0, показатель эффективности (9) которой максимален:
max
= . (10)P ϵSa
Стратегия Аi0 оптимальная среди чистых стратегий по критерию Байеса относительно выигрышей, является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA.
При принятии решений в условиях риска по критерию Байеса относительно выигрышей можно обойтись только чистыми стратегиями, не используя смешанные.
Рассмотрим ту же игру с природой матрицей, в которой известны вероятности состояний природы q1 , ..., qn. При принятии решений в условиях риска можно пользоваться не только средними выигрышами, но и средними рисками. Составим матрицу рисков для матрицы A, используя формулу рисков (3)
Таблица 3 – Матрица рисков
Пj Аi | П1 | П2 | … | Пn |
А1 | r11 | r12 | … | r1n |
А2 | r21 | r22 | … | r2n |
… | … | … | … | … |
Аm | rm1 | rm2 | … | rmn |