является взвешенной средней рисков i-й строки матрицы (таблица 3) с весами pi, i=1, ..., т.
Оптимальной среди чистых стратегий по критерию Байеса относительно рисков является стратегия Пj, показатель неэффективности (11) которой минимален, т.е. минимален средний риск
ṝi0 = min ṝi. (12)1≤ i ≤m
Определим понятие риска при использовании игроком А смешанной стратегии и при состоянии природы Пj, j = l, ..., п, как разность
r (P, Пj) = [max H (U, Пj)] - H (P, Пj), j=1, …, n. (13)
U ϵSa
между максимальным выигрышем max H (U, Пj) при всех смешанных стратегиях U = ( u1 , ..., un ) ϵ SA и при состоянии природы Пj и выигрышем H (P, Пj) при смешанной стратегии P = ( p1 , ..., pn ) и при состоянии природы Пj.
В качестве показателя неэффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Байеса относительно рисков рассмотрим взвешенную среднюю рисков (13) с весовыми коэффициентами, равными вероятностям q1 , ..., qn состояний природы:
= . (14)
Оптимальной среди всех смешанных (в том числе и чистых) стратегий по критерию Байеса относительно рисков будем считать стратегию P0, показатель неэффективности которой, вычисляемый по формуле (14), минимален:
min
= . (15)P ϵSa
Если Аi0 - стратегия, оптимальная среди чистых стратегий по критерию Байеса относительно рисков, то она является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA.
При принятии решения в условиях риска по критерию Байеса относительно рисков так же как и в случае критерия Байеса относительно выигрышей достаточно использовать одни чистые стратегии, не рассматривая смешанные.
Критерии Байеса относительно выигрышей и относительно рисков эквивалентны, т.е. если стратегия Аi0 является оптимальной по критерию Байеса относительно выигрышей, то она является оптимальной и по критерию Байеса относительно рисков, и наоборот, стратегия Аi0, оптимальная по критерию Байеса относительно рисков, оптимальна и по критерию Байеса относительно выигрышей.
В предыдущих двух критериях Байеса известные вероятности q1 , ..., qn состояний природы могли быть получены из статистических данных, отражающих многократное решение подобных задач, или в результате наблюдений за поведением природы. Однако, довольно часто складывается такая ситуация, когда мы лишены возможности определить вероятности состояний природы указанными способами. Желая все же принять решение в условиях риска, мы вынуждены оценить вероятности состояний природы субъективно. Существуют различные методы численной субъективной оценки степени правдоподобности состояний природы. Один из них состоит в том, что мы не можем отдать предпочтение ни одному из состояний природы, и потому считаем их равновероятными, т.е. q1 = .. .=qn =
. Этот принцип называется «принципом недостаточного основания» Лапласа. На нем основан критерий Лапласа относительно выигрышей.Показателем эффективности стратегии Аi по критерию Лапласа относительно выигрышей называется среднее арифметическое выигрышей i-й строки:
āi = , i=1, …, m. (16)
Оптимальной среди чистых стратегий по критерию Лапласа относительно выигрышей считается стратегия Аi0 показатель эффективности, кот-
орой, вычисляемый по формуле (16), максимален, т.е. āi0 = max āi.
1≤ i ≤m
Очевидно, что критерий Лапласа относительно выигрышей есть частный случай критерия Байеса относительно выигрышей при q1 = .. .=qn =
. Поэтому все утверждения на счет критерия Байеса относительно выигрышей, остаются в силе и для критерия Лапласа относительно выигрышей.Подставляя (16) в (9), получим показатель эффективности смешанной стратегии P = ( p1 , ..., pn ) по критерию Лапласа относительно выигрышей
= . (17)
Стратегия P = ( p1 , ..., pn ) будет оптимальной среди всех смешанных стратегий множества SA по критерию Лапласа относительно выигрышей, если она максимизирует показатель эффективности (17).
Оптимальная среди чистых стратегия Аi по критерию Лапласа относительно выигрышей является оптимальной по тому же критерию и среди всех смешанных стратегий.
Критерий Байеса относительно рисков при равновероятных состояниях природы, q1 = .. .=qn =
, превращается в критерий Лапласа относительно рисков. Тогда величина , получающаяся из (11) при qj = , j=1, …, n, или более простая величина представляет собой показатель неэффективности стратегии Аi по критерию Лапласа относительно рисков. Следовательно, оптимальной среди чистых стратегий по критерию Лапласа относительно рисков является стратегия Аi0, показатель неэффективности которой минимален. Подставляя в (14) значения qj = , j=1, …, n, получим показатель неэффективности смешанной стратегии Р по критерию Лапласа относительно рисков, вместо которого можно рассматривать более простую величину = . Стратегия Р, для которой показатель принимает минимальное значение, является оптимальной среди всех стратегий множества SA. Чистая стратегия, оптимальная среди чистых стратегий по критерию Лапласа относительно рисков, оптимальна по тому же критерию и среди всех смешанных стратегий множества SA.Критерии Лапласа относительно выигрышей и относительно рисков эквивалентны.
В практике принятия решений часто встречается случай, когда нам неизвестны вероятности состояний природы, но мы имеем представление о том, какие состояния природы более правдоподобны, какие менее правдоподобны, а какие равноправдоподобны. Поэтому мы можем расположить (неизвестные) вероятности состояний природы в виде убывающей или возрастающей последовательности. Для простоты предположим, что расположение q1, ..., qn уже и есть монотонная последовательность. Если, например, эта последовательность строго убывает, то правдоподобнее всех состояние П1 затем по степени правдоподобности следует состояние П2, и т. д., наименьшей правдоподобностью обладает состояние Пn. Не зная, на сколько одна вероятность состояния природы отличается от другой, мы можем предположительно придать им относительные значения, пропорциональные членам некоторой (подходящей на наш взгляд) монотонной последовательности положительных чисел τ1, ..., τn, т.е.
q1 : q2 : q3 : ... : qn = τ1 : τ2 : τ3 : ... : τn . (18)
Из (18) следует, что если q1 , ..., qn убывающая, соответственно возрастающая, последовательность, то убывающей, соответственно возрастающей, является и последовательность τ1 , ..., τn.
При этом следует учитывать нормировочное равенство
=1 (19)
Вероятность j-ого столбца определяется по формуле:
qj =
, j=1, …, n (20)Из (20) и (19) получим:
1 =
= = . (21)