Смекни!
smekni.com

Принятие решений в условиях риска 3 (стр. 2 из 8)

Если aij = ωj, то риск rij, является максимальным. Следовательно, по критерию риска стратегия Аi в этом случае наихудшая.

Если βj = ωj, то все выигрыши j-столбце матрицы игры равны между собой: ωj = a1j = a2j = … = amj = βj и риск rij = 0. Поэтому в этом случае любая стратегия игрока А при состоянии природы Пj безрисковая.

Для матрицы А матрица рисков RA имеет ту же размерность и следующий вид:

Таблица 2 – Матрица рисков

RA =

Пj Аi

П1

П2

Пn

А1

r11

r12

r1n

А2

r21

r22

r2n

Аm

rm1

rm2

rmn

Отметим, что матрица выигрышей А однозначно порождает матрицу рисков RA, поскольку каждый риск rij однозначно определяется соответствующими показателем благоприятности βj состояния природы Пj, и выигрышем aij. Обратное неверно: одна и та же матрица рисков может соответствовать разным матрицам выигрышей.

В понятии оптимальной стратегии лежат различные соображения, составляющие содержание соответствующих критериев оптимальности стратегий.

Перед тем как переходить к выбору оптимальной стратегии, целесообразно возможности упростить матрицу А, уменьшив число строк на основании принципа доминирования стратегий игрока А.

1.2 Упрощение матрицы игры

Если какая-нибудь из стратегий игрока А окажется доминирующей каждую из остальных его стратегий, то она и должна выбираться игроком А в качестве пред­почтительной, поскольку его выигрыш при этой стратегии и при любом состоянии природы П не меньше выигрыша при любой из остальных стратегий.

Если же матрица игры не обладает указанным свойством, т.е. у игрока А нет стратегии, доминирующей каждую из остальных его стратегий, то нужно посмотреть, нет ли у него доминируемых или дублирующих стратегий. При наличии таковых, соответствующие им строки матрицы можно удалить, уменьшив тем самым ее размерность.

Таким образом, в играх с природой можно и полезно пользоваться принципом доминирования стратегий игрока А (строк матрицы игры). Однако принцип до­минирования стратегий (состояний) природы (столбцов матрицы игры) недопустим, поскольку природа не выбирает свои состояния с целью по возможности большего уменьшения выигрышей игрока А, для нее нет более или менее эффективных состояний.

1.3 Критерий Байеса относительно выигрышей

Предположим, что статистик из прошлого опыта известны не только состояния Пj, j = l, ..., п, в которых может находиться природа П, но и соответствующие вероятности q1 , ..., qn с которым природа П реализует эти состояния. Тогда мы находимся в ситуации принятия решения в условиях риска.

Показателем эффективности стратегии Аi по критерию Байеса относительно выигрышей называется среднее значение, или математическое ожидание выигрыша i-й строки с учетом вероятностей всех возможных состояний природы. Обозначая это среднее значение через āi, будем иметь:

āi = q1ai1 + q2ai2 + … + qnain =

, i=1, …, m. (6)

Таким образом, at представляет собой взвешенное среднее выигрышей i-й строки, взятых с весами q1 , ..., qn.

Оптимальной среди чистых стратегий по критерию Байеса относительно выигрышей считается стратегия Аi0 с максимальным показателем эффективности, т.е. с максимальным средним выигрышем:

āi0 = max āi. (7)

1≤ i ≤m

Таким образом, выбранное решение по этому критерию является оптимальным не в каждом отдельном случае, а в среднем.

Распространим понятие показателя эффективности по критерию Байеса относительно выигрышей на смешанные стратегии игрока П.

Пусть P = ( p1 , ..., pn ) - некоторая смешанная стратегия игрока А, при которой чистая стратегия Аi используется им с вероятностью pi, i=1, ..., т. Тогда выигрыш игрока А при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы Пj будет равен

H (P, Пj) =

, j=1, …, n. (8)

Показателем эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей назовем среднее значение выигрышей, с учетом вероятностей q1 , ..., qn состояний природы. Обозначим этот показатель через

.

Получим:

=
=
=
=
. (9)

Таким образом показатель эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно выигрышей представляет собой взвешенное среднее показателей эффективности чистых стра­тегий Аi, i = l, ..., m, по тому же критерию с весами pi, i = l, ..., m.

Если, в частности, стратегия P = ( p1 , ..., pn ) является чистой стратегией Аk, k = l, ..., m, то pi = 0 i k, pk = 1, и ее показатель эффективности как смешанной стратегии

, превращается в ее показатель эффективности как чистой стратегии āk, вычисляемый по формуле (6).

Пусть SA - множество всех смешанных (в том числе и чистых) стратегий игрока A. Оптимальной среди всех стратегий множества SA по критерию Байеса относительно выигрышей назовем стратегию P0, показатель эффективности (9) которой максимален:

max

=
. (10)

P ϵSa

Стратегия Аi0 оптимальная среди чистых стратегий по крите­рию Байеса относительно выигрышей, является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA.

При принятии решений в условиях риска по критерию Байеса относительно выигрышей можно обойтись только чистыми стратегиями, не используя смешанные.

1.4 Критерий Байеса относительно рисков

Рассмотрим ту же игру с природой матрицей, в которой известны вероятности состояний природы q1 , ..., qn. При принятии решений в условиях риска можно пользоваться не только средними выигрышами, но и средними рисками. Составим матрицу рисков для матрицы A, используя формулу рисков (3)

Таблица 3 – Матрица рисков

Пj Аi

П1

П2

Пn

А1

r11

r12

r1n

А2

r21

r22

r2n

Аm

rm1

rm2

rmn

Показателем неэффективности стратегии Аi по критерию Байеса относи­тельно рисков называется среднее значение, или математическое ожидание риска i-й строки матрицы (таблица 3), вероятности которых, очевидно, совпадают с вероятностями состояний природы. Обозначим средний риск при стратегии Аi через ṝi, тогда

i = q1 ri1 + q2 ri2 + … + qn rin =
, i=1, …, m. (11)