Аксиома 4. Аксиома измеримости. Если х у
z или х у z, то существует единственная вероятность α, такая, что у G(x, z: α).Поясним смысл этой аксиомы. Пусть, например, имеем три исхода: х = 1000; у = 0; z означает смерть игрока. Исходя из здравого смысла смерть нельзя сравнивать ни с каким выигрышем, и соответствующего этому исходу значения вероятности α существовать не может. Однако в жизни бывают ситуации, когда некий проигрыш равнозначен смерти. Тогда утверждение у
G(x, z: α) можно считать справедливым для некоторого значения .Аксиома 5. Аксиома ранжирования. Если альтернативы у и и находятся по предпочтительности между альтернативами х и z и можно построить игры, такие, что индивид безразличен в отношении к выбору между у и G(x, z: α2), a также к выбору между и и G(x, z: α2), то при
у и.Поясним смысл этой аксиомы. Пусть существуют следующие альтернативы: х = 1000; у = 500; и = 200; z = –10. Пусть эквивалентны две пары ситуаций, одна из которых неигровая, а другая игровая:
1) гарантированно получить 500 или игра: с вероятностью α1, выиграть 1000 и с вероятностью (1 – α1) проиграть 10, т.е.
500
G(1000, -10: α1);2) гарантированно получить 200 или игра: с вероятностью α2 выиграть 1000 и с вероятностью (l - α2) проиграть 10, т.е.
200
G(1000, -10: α2).Очевидно, что при указанных условиях α1
α2. Если α1 + α2, то у и.Утверждение аксиомы вполне соответствует здравому смыслу: чем больше вероятность крупного выигрыша, тем больше игра «стоит», т.е. тем большая плата потребуется за приобретение права участвовать в этой игре.
Если принять приведенные аксиомы и предположить, что люди предпочитают большее количество некоторого блага меньшему, то все это в совокупности определяет рациональное поведение ЛПР.
При названных предположениях американскими учеными Дж. Нейманом и О. Моргенштерном было показано, что ЛПР при принятии решения будет стремиться к максимизации ожидаемой полезности. Другими словами, из всех возможных решении он выберет то, которое обеспечивает наибольшую ожидаемую полезность. Сформулируем определение полезности по Нейману-Моргенштерну.
Определение 4.2. Полезность - это некоторое число, приписываемое лицом, принимающим решение, каждому возможному исходу. Функция полезности Неймана - Моргенштерна для ЛПР показывает полезность, которую он приписывает каждому возможному исходу. У каждого ЛПР своя функция полезности, которая показывает его предпочтение к тем или иным исходам в зависимости от его отношения к риску.
Определение 4.3. Ожидаемая полезность события равна сумме произведений вероятностей исходов на значения полезностей этих исходов.
Проиллюстрируем практическую реализацию введенных понятий на примере расчета ОДО и сопоставления этого значения с полезностью.
Задача 4.1. Нефтеперерабатывающая фирма решает вопрос о бурении скважины. Известно, что если фирма будет бурить, то с вероятностью 0,6 нефти найдено не будет; с вероятностью 0,1 запасы месторождения составят 50 000 т; с вероятностью 0,15 -100 000 т; с вероятностью 0,1 - 500 000 т; с вероятностью 0,05 -1 000 000 т. Если нефть не будет найдена, то фирма потеряет 50 000 дол.; если мощность месторождения составит 50 000 т, то потери снизятся до 20 000 дол.; мощность месторождения в 100 000 т принесет прибыль 30 000 дол.; 500 000 т- 430 000 дол.; 1 000 000 т - 930 000 дол. Дерево решений данной задачи представлено на рис. 4.1. Нетрудно рассчитать ожидаемое значение выигрыша:
ОДО = 0,6(-50 000) + 0,1 (-20 000) + 0,15*30 000 + + 0,1*430 000 + 0,05*930 000 = 62 000 дол.
Рис. 4.1. Дерево решений для задачи 4.1 (прибыль указана в долларах)
Если ЛПР, представляющий фирму, безразличен к риску и принимает решение о проведении буровых работ на основании рассчитанного ОДО, то он воспринимает ожидаемую полезность как пропорциональную ОДО, полагая U = 62. Учитывая, что U - индивидуальное число, характеризующее ЛПР, нули, отвечающие расчету ОДО, можно отбросить. В этом случае функция полезности U(v), где v - прибыль, получаемая при различных исходах, является прямой с положительным наклоном. Ниже будет показано, что U можно задавать с точностью до некоторого монотонного преобразования.
Для принятия решения в случае небезразличия ЛПР к риску необходимо уметь оценивать значения полезности каждого из допустимых исходов. Дж. Нейман и О. Моргенштерн предложили процедуру построения индивидуальной функции полезности, которая (процедура) заключается в следующем: ЛПР отвечает на ряд вопросов, обнаруживая при этом свои индивидуальные предпочтения, учитывающие его отношение к риску. Значения полезностей могут быть найдены за два шага.
Шаг 1. Присваиваются произвольные значения полезностей выигрышам для худшего и лучшего исходов, причем первой величине (худший исход) ставится в соответствие меньшее число. Например, для приведенной выше задачи U(-50 000 дол.) = 0, а U(930 000 дол.) = 50. Тогда полезности промежуточных выигрышей будут находиться в интервале от 0 до 50. Полезность исхода даже для одного индивида определяется не однозначно, а с точностью до монотонного преобразования. Пусть, например, имеем x1, х2,..., хn - полезности, приписываемые п ожидаемым значениям выигрышей. Тогда α+βx1, α+βх2,..., α+βхn (где (β > 0) также будут полезностями. Если в задаче 4.1 при расчете полезности отбросить последние нули, это будет эквивалентно линейному преобразованию функции полезности при α = 0 и β = 0,001.
Шaг 2. Игроку предлагается на выбор: получить некоторую гарантированную денежную сумму
, находящуюся между лучшим и худшим значениями S и s, либо принять участие в игре, т.е. получить с вероятностью р наибольшую денежную сумму S и с вероятностью (1 - р) - наименьшую сумму s. При этом вероятность следует изменять (понижать или повышать) до тех пор, пока ЛПР станет безразличным в отношении к выбору между получением гарантированной суммы и игрой. Пусть указанное значение вероятности равно р0. Тогда полезность гарантированной суммы определяется как среднее значение (математическое ожидание) полезностей наименьшей и наибольшей сумм, т.е.U(
) = p0 U(S) + (1 – p0)U(s). (4.1)Рассчитаем полезность результатов любого из возможных исходов для задачи 4.1. Пусть для ЛПР безразлично: потерять 20 000 дол. или принять участие в игре (выигрыш 930 000 дол. с вероятностью 0,1 или проигрыш 50 000 дол. с вероятностью 0,9). Согласно формуле (4.1) имеем:
U(-20) = 0,1 U(930) + 0,9 U(-50) = 5,
при этом по определению принято, что U(-50) = 0, U(930) = 50, откуда следует, что U(-20) = 5.
Таким образом, если определена шкала измерения, то может быть построена функция полезности ЛПР (рис. 4.2).
Рис. 4.2. График полезности для задачи 4.
Рис. 4.3. Типы функции полезности Неймана — Моргенштерна для ЛПР, не склонного к риску (а), безразличного к риску (б), склонного к риску (в)
В общем случае график функции полезности может быть трех типов (рис. 4.3):
• для ЛПР, не склонного к риску, — строго вогнутая функция, у которой каждая дуга кривой лежит выше своей хорды (рис. 4.3 а);
• для ЛПР, безразличного к риску, — прямая линия (рис. 4.3 б),
• для ЛПР, склонного к риску, — строго выпуклая функция, у которой каждая дуга кривой лежит ниже своей хорды (рис. 4.3 в).
4.2. ИЗМЕРЕНИЕ ОТНОШЕНИЯ К РИСКУ
Исследуем график функции полезности, представленной на рис. 4.4. Для такого типа ЛПР полезность среднего выигрыша (полезность ОДО) больше ожидаемой полезности игры: с вероятностью p выиграть М1 и с вероятностью (1 - р) выиграть М2.