3. Построение нейронной сети обратного распространения погрешности с числом нейронов входного слоя, соответствующим числу ключевых параметров игровой ситуации, числом нейронов выходного слоя, соответствующем числу параметров хода игрока, а также некоторым числом нейронов скрытого слоя, предназначенных для формирования внутренних представлений нейронной сети о ситуациях неопределенности, соответствующих индивидуальным предпочтениям участника в той мере, в которой эти предпочтения зависят от параметров ситуации и проявляются в действиях играющего.
4. Обучение и тестирование нейронной сети с подбором оптимального (в смысле качества обучения) числа скрытых нейронов (и слоев) и возможным исключением несущественных параметров и связей. При обучении задается относительно высокий уровень требуемой точности (толерантности), понижаемый до рационально приемлемого значения при тестировании сети.
5. Использование обученной нейронной сети для имитации индивидуальных предпочтений по риску при управлении портфелем, а также анализ и интерпретация связей и внутренних представлений, возникающих в нейросети, с выделением существенных и несущественных факторов.
Предпочтения коллектива (фирмы, организации) могут быть иногда хотя бы вербально сформулированы в публичных документах (правилах, уставах, инструкциях и т.п.), проявляться в поведении массы и публичных поступках лиц, несущих ответственность за коллектив. Эта особенность часто облегчает выявление и формализацию предпочтений. Естественно, возможны ситуации тождества индивидуальных и коллективных предпочтений (диктатура, произвол администрации, когда физическое лицо является одновременно юридическим, и т.п.) следует отметить и сложность проблемы согласования интересов, возникающую в коллективах, в том числе иррациональность предпочтений коллектива. Имеются в виду закон Кондорсе, заключающийся в отсутствии транзитивности в процедуре выбора по правилу большинства, и известная теорема Эрроу[4] о невозможности построения демократического коллективного правила выбора, не противоречащего ряду аксиом-требований рациональности.
Проблема согласования предпочтений по риску – один из самых животрепещущих вопросов, встающих при построении правила коллективного принятия решений с учетом предпочтений по риску различных участников. Сама проблема согласования интересов плодотворно изучалась теорией игр и той частью экономической науки, которая занимается теорией благосостояния. В частности, теория игр предложила множество решений различных конфликтных задач. Было предложено большое количество критериев эффективности, играющих роль правила коллективного выбора: эффективность по Парето, эффективность по Калдору-Хиксу, двойной критерий Ситовски и др. Согласование оценок и предпочтений обладает некоторыми специфическими особенностями в условиях неопределенности. Во-первых, участники обладают различной склонностью к риску. Во-вторых, участники по-разному оценивают риск одной и той же ситуации (различные субъективные вероятности). В-третьих, апостериорные оценки принятых решений и конфликтов отличаются от априорных оценок. В-четвертых, место булевой логики занимает нечеткая логика, допускающая суждения с разной степенью уверенности в их истинности.
Отталкиваясь от одного из принципов управления риском – принципа демократии по риску, провозглашающего право каждого на риск, следует попытаться предложить решение проблемы согласования оценок и предпочтений риска.
В принципе игровая модель конфликта интересов разных участников, допускающая смешанные (случайные, смесь различных возможных исходов) стратегии, во многом отвечает данной проблематике. На практике равновесные решения часто находятся путем передачи риска от хеджеров спекулянтам в обмен на премию за риск. Однако часто возникает проблема, когда риск не передается. Например, при принятии управленческих решений совладельцы предприятия совместно несут риски, возникающие из неопределенности, согласовывая как-то свои предпочтения по риску. Более осторожные из них пытаются застраховаться в одиночку. При этом смешанные стратегии не всегда возможны, приходится довольствоваться чистыми (с единственным исходом) стратегиями – предпринимать то или иное конкретное действие. При большом количестве вариантов действий и предпочтений размерность задачи резко возрастает. Особенностью задач управления является их оперативный характер, накладывающий ограничения на время решения организационных проблем, к которым относится согласование предпочтений. Одним из вариантов решения этого вопроса является делегирование полномочий по управлению. Существуют соответствующие управленческие теории (Теория передачи полномочий, Теория заинтересованных лиц и др.), в которых обособляются интересы различных групп лиц. Часто инициатива уступается партнеру, родственнику, общественному институту (например, арбитражному суду). Практически смешанную стратегию можно рассматривать как сознательную «передачу полномочий» моделируемому случаю. Изложенные рассуждения приводят к мысли о целесообразности рассмотрения перспектив использования нейронных сетей теории адаптивного резонанса для согласования предпочтений по риску. Основы теории адаптивного резонанса были заложены С. Гроссбергом в 1976 г. Одной из моделей является ATRI – модель нейросети, реализующая принципы теории адаптивного резонанса. Эта сеть состоит из двух слоев нейронов F1 и F2. Входная информация (в бинарном виде) поступает в слой F1. Нейроны этого слоя возбуждаются (преобразуют вход по некоторой формуле с постоянными параметрами), и в зависимости от значений возбужденного состояния пороговая функция определяет выходное значение каждого нейрона, передаваемое по прямым связям на вход нейронов слоя F2. При этом на вход каждого нейрона слоя F2 поступает взвешенная весами связей сумма соответствующих выходных значений нейронов слоя F1. После возбуждения нейронов слоя F2 определяется нейрон-«победитель», имеющий максимальное значение возбужденного состояния. Его выходное значение передается по обратным связям нейронам слоя F1. Взвешенное весами обратных связей оно преобразуется в возбужденные состояния нейронов слоя F1, пороговая функция определяет выходные значения этих нейронов – выход нейронной сети. Нейросеть самообучается по обучающим примерам за несколько циклов путем изменения весов связей в зависимости от степени достижения уровня. В результате обучения устанавливается резонанс, когда для пары векторов значений при подаче на вход нейросети одного вектора второй является выходом и наоборот. Применение нейросети для согласования интересов можно попытаться организовать следующим образом. Пусть несколько участников должны или отклонить, или принять некоторое решение. Каждый из участников определился в своем мнении и высказывается либо за, либо против. На вход нейронной сети с адаптивным резонансом поступает в бинарном виде информация о предпочтениях участников (например, 1 – за, 0 – против), число которых соответствует числу нейронов входного слоя. Участники «делегируют» внутренним нейронами сети полномочия проголосовать обсуждаемый вопрос, причем результаты будут зависеть от предпочтений участников. От веса голоса каждого участника для каждого внутреннего нейрона, т.е. степени компетентности участников (веса прямых синаптических связей), от веса голоса каждого внутреннего нейрона для каждого участника (веса обратных синаптических связей) и процедуры голосования (пороговой функции) нейронов. Процедура согласования «голосов» внутренних нейронов уже существует (диктатура самого возбужденного нейрона-«победителя»; в случае многослойной сети может применяться какое-либо другое правило, например нейроны могут «делегировать полномочия» нейронам более высокого уровня и т.д.). тогда решение будет «принято», а адаптивный резонанс будет наблюдаться в случае, если «голоса» нейронов (с учетом их весов) воспроизводят первоначально поданные голоса участников. Это означает, что нейроны, а следовательно, и их выбор, вероятно, отражают интересы участников с некоторой точностью, достигнутой при обучении нейросети. Иначе говоря, здесь предполагается, что процедура коллективных выборов хороша с той точностью, с которой можно по результатам голосования делегированных представителей воспроизвести результаты голосования избирателей. Самообучение нейросети заключается в подборе весов нейронов, обеспечивающих резонанс, т.е. представительность интересов. Важно отметить, что нейроны в данном случае не обладают какими-то особыми свойствами, кроме пороговой функции, это лишь элементы нейросети, поэтому их заменяет компьютер.
Поскольку в условиях неопределенности наиболее естественно использовать нечеткую логику, участнику следует предоставить возможность распределить свои голоса между оценками «за» и «против» согласно его нечетким суждениям. Это реализуется посредством соответствующего оформления входного слоя нейронной сети для представления предпочтений.
Иными словами. Можно приспособить процесс принятия нейронной сетью задач бинарной классификации с учетом нечеткой логики для коллективного выбора по критерию представительности мнений участников (резонанс) в условиях неопределенности. Итак, основные трудности с которыми приходится сталкиваться при решении проблемы выявления индивидуальных предпочтений по риску, заключаются в нечеткости, противоречивости данных о поведении исследуемого индивидуума в условиях неопределенности, в отсутствии обоснованных предположений о конкретных закономерностях этого поведения, в его постоянном изменении, что делает практически малоэффективными (неадекватными и дорогостоящими) попытки построения функций полезности и другие способы моделирования.