3. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.
1.7.3 Максиминный критерий Вальда
Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:
Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР:
Wi = minjaij. (11)
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально: W = maxWi.
Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется.
Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:
1. О возможности появления состояний окружающей среды ничего не известно;
2. Решение реализуется только один раз;
3. Необходимо исключить какой бы то ни было риск.
1.7.4 Критерий минимаксного риска Сэвиджа
Величина (amaxj – aij ), где amaxj - максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии. Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией.
На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска.
Для определения оптимальной стратегии по данному критерию на основе платёжной матрицы рассчитывается матрица рисков, каждый коэффициент которой (rij) определяется по формуле: rij = amaxj – aij. Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий ЛПР: Ri = maxjrij.
Оптимальной по данному критерию считается та стратегия, в которой значение Ri минимально: W = minRi.
Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ-критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша.
1.7.5 Критерий пессимизма-оптимизма Гурвица
В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска. Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале [0, 1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма. Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях.
Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:
Wi = C×minjaij + (1-C) ×maxjaij, (12)
где C – коэффициент пессимизма.
Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально: W = maxWi.
При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”, делающего ставку на то, что «выпадет» наилучший случай.
Критерий Гурвица применяется в ситуации, когда :
1. Информация о состояниях окружающей среды отсутствует или недостоверна;
2. Необходимо считаться с появлением каждого состояния окружающей среды;
3. Реализуется только малое количество решений;
4. Допускается некоторый риск.
Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале [0, 1]. Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае – ММ-критерий
Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле:
, (13)где u – параметр достоверности информации о вероятностях состояний окружающей среды.
Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально: W = maxWi.
Данный критерий применим в следующем случае:
1. Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;
2. Принятое решение теоретически допускает бесконечно много реализаций;
3. При малом числе реализации допускается некоторый риск [17].
Решать задачи теории игр можно в таких программных средах, как Tora, Per, Excel, LINDO61, LINGO8. Следующие рассматриваемые примеры будут частично решаться в средах MicrosoftExcel, Tora.
MSExcel удобен тем, что он установлен на любом компьютере, всем знаком и прост в применении. А программная система оптимизации Tora является самодостаточной системой в том смысле, что все инструкции и пояснения, необходимые для работы с этой программой, заключены в названиях пунктов меню, командных кнопок, опций и других элементов управления. Tora может работать только с разрешением экрана 800×600 или 1024×768 пикселей.
Пример решения матричной игры в чистых стратегиях, в условиях реальной экономики, в ситуации борьбы двух предприятий за рынок продукции региона
Задание:
Два предприятия производят продукцию и поставляют её на рынок региона. Они являются единственными поставщиками продукции в регион, поэтому полностью определяют рынок данной продукции в регионе.
Каждое из предприятий имеет возможность производить продукцию с применением одной из трёх различных технологий.
В зависимости от качества продукции, произведённой по каждой технологии, предприятия могут установить цену единицы продукции на уровне 10, 6 и 2 денежных единиц соответственно.
При этом предприятия имеют различные затраты на производство единицы продукции (см. таблицу 3).
Таблица 3
Затраты на единицу продукции, произведенной на предприятиях региона (д.е.).
Технология | Цена реализации единицы продукции, д.е. | Полная себестоимость единицы продукции, д.е. | |
Предприятие 1 | Предприятие 2 | ||
I | 10 | 5 | 8 |
II | 6 | 3 | 4 |
III | 2 | 1.5 | 1 |
В результате маркетингового исследования рынка продукции региона была определена функция спроса на продукцию: Y = 6 – 0.5.
Данные о спросе на продукцию в зависимости от цен реализации приведены в таблице 4.
Таблица 4
Спрос на продукцию в регионе, тыс. ед.
Цена реализации 1 ед. продукции, д.е. | Средняя цена реализации 1 ед. продукции, д.е. | Спрос на продукцию, тыс. ед. | |
Предприятие 1 | Предприятие 2 | ||
10 | 10 | 10 | 1 |
10 | 6 | 8 | 2 |
10 | 2 | 6 | 3 |
6 | 10 | 8 | 2 |
6 | 6 | 6 | 3 |
6 | 2 | 4 | 4 |
2 | 10 | 6 | 3 |
2 | 6 | 4 | 4 |
2 | 2 | 2 | 5 |
Значения Долей продукции предприятия 1, приобретенной населением, зависят от соотношения цен на продукцию предприятия 1 и предприятия 2. В результате маркетингового исследования эта зависимость установлена и значения вычислены (см. таблицу 5).
Таблица 5
Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е. | Доля продукции предприятия 1, купленной населением | |
Предприятие 1 | Предприятие 2 | |
10 | 10 | 0,31 |
10 | 6 | 0,33 |
10 | 2 | 0,18 |
6 | 10 | 0,7 |
6 | 6 | 0,3 |
6 | 2 | 0,2 |
2 | 10 | 0,92 |
2 | 6 | 0,85 |
2 | 2 | 0,72 |
По условию задачи на рынке региона действует только 2 предприятия. Поэтому долю продукции второго предприятия, приобретённой населением, в зависимости от соотношения цен на продукцию можно определить как единица минус доля первого предприятия.