Смекни!
smekni.com

Анализ, синтез, планирование решений в экономике (стр. 45 из 65)

При обработке матрицы сходства максимальное значение ее правого собственного вектора будет соответствовать наиболее ти­повому элементу, т. е. наиболее схожему со всеми остальными рассматриваемыми в этой матрице объектами. Минимальное зна­чение в правом собственном векторе матрицы включения характе­ризует наиболее оригинальный (экзотичный) объект.

Вычисление правого собственного вектора положительной квад­ратной матрицы проводится итерационным алгоритмом, исполь­зованным для обработки матриц парных сравнений (см. разд. 2.2).

Кластеризация морфологических множеств

Генерируемые на морфологических таблицах морфологические множества вариантов систем имеют сложную неоднородную внут­реннюю структуру. Выявление закономерностей строения исследу­емых множеств позволяет более эффективно решать основные за­дачи по поиску, прогнозированию и планированию рациональных систем. Предварительная кластеризация морфологических множеств с учетом особенностей структуры и свойств вариантов систем по­могает во многих задачах преодолеть проклятие размерности, отсе­ять неинтересные для исследователя варианты систем. Можно вы­делить два способа формирования классов. Первый способ заклю­чается в том, что классы формируются в процессе конкретного исследования. Второй способ предполагает предварительное зада­ние классов исследователем. При проведении исследований, связан­ных с выявлением новых классов, применяются методы, позволяю­щие проводить иерархическое упорядочение морфологических мно­жеств на основе мер сходства; определять подмножества вариан­тов, наиболее сходных между собой по различным признакам и свойствам; выявлять классы, содержащие наиболее типовые или наиболее оригинальные варианты. Если отряды классов задаются предварительно исследователем, то решается задача идентификации. Цель идентификации — распознавание синтезируемого на морфо­логической таблице варианта системы и отнесение его к тому или иному классу с учетом решающих правил. Таким образом, осуще­ствляется сортировка синтезируемых вариантов по классам.

Результаты кластеризации в конечном итоге определяются спо­собом описания альтернатив в морфологической таблице, прави­лом вычисления меры сходства, методом построения иерархичес­кой классификации, структурой морфологической таблицы, спо­собом задания классов при решении задачи идентификации.

Решая задачи исследования морфологических множеств на ос­нове методов кластерного анализа, следует различать три суще­ственно отличающихся способа описания альтернатив в морфоло­гической таблице. Способ описания альтернатив обусловливает метод вычисления меры сходства между синтезируемыми вариан­тами систем. Можно выделить три способа описания альтернатив и соответствующие им правила определения сходства между ва­риантами.

Первый способ описания каждой альтернативы предполагает указание только ее наименования, например описание альтернати­вы может быть представлено в виде Аij. При втором способе описа­ния каждая альтернатива имеет наименование и экспертные оцен­ки, указывающие степень сходства со всеми другими альтернатива­ми, принадлежащими одной обобщенной функциональной подсис­теме. Третий способ представления предусматривает указание для каждой альтернативы классификационных признаков. Указанная для характеристики альтернатив информация используется при вычис­лении мер сходства между синтезируемыми вариантами. Вычисле­ние мер сходства осуществляется по различным правилам.

При первом способе описания альтернатив в виде наи­менований Аij меры сходства между двумя вариантами S' и S" вы­числяются по известной формуле

с учетом следующих правил:

• число элементов множества, образующего вариант системы S¢ или S¢¢', равно числу альтернатив Аij, входящих в данное множе­ство;

• число пересечений элементов двух множеств S' и S" равно числу одинаковых пар альтернатив А¢lm и А¢¢lm, принадлежащих соответственно вариантам S' и S", т. е.

При втором способе описания альтернатив на основе экспертной оценки их степени сходства друг с другом расчет меры сходства между двумя вариантами S¢ и S" системы определяется по формулам:

где Сl (A¢lm, А¢¢lm) — экспертное интегрированное значение меры сходства пары альтернатив, принадлежащих l-и обобщенной функциональ­ной подсистеме;

L число обобщенных функциональных подсистем, образую­щих вариант системы;

Сi (Z¢ilm, Z¢¢ilm) — экспертное значение меры сходства пары альтернатив по i-му классификационному признаку или критерию качества;

ri весовой коэффициент, определяющий вклад в меру сходства i-ro признака или критерия;

К — число признаков или критериев, по которым описаны свой­ства альтернатив А¢lm и A¢¢lm.

При третьем способе описания вариантов синтезируе­мых систем определение меры сходства между вариантами осу­ществляется по выражению (5.9). Вариант системы здесь описан множеством значений признаков Zilm = {0,1}. Значение признака Zilm равно единице в описании альтернативы Аlm, если признак при­сутствует в ней, в противном случае Zilm = 0.

Рассмотрим строение морфологических множеств относитель­но иерархических классификаций. Первоначально исследуем мор­фологическое множество, включающее варианты, альтернативы которых описаны в соответствии с первым способом, т. е. про­стым указанием их наименований. При проведении исследований данного типа целесообразно определить наиболее приемлемый метод классификации. Критерием для отбора метода кластериза­ции может являться хорошая интерпретируемость полученных результатов, т. е. достижение высокой адекватности между моде­лью-классификацией и реальной системой-прототипом. Проана­лизируем шесть наиболее простых и распространенных методов иерархической классификации: медианы, максимальных значений, минимальных значений, средней группы, центроиды, Уорда. Осу­ществим кластеризацию морфологического множества, система­тизированного морфологической таблицей (табл. 5.11). Исходное морфологическое множество (табл. 5.12) сформировано алгорит­мом лексикографического упорядочения альтернатив.

Объекты морфологического множества состоят из трех функ­циональных подсистем. С учетом выражения (5.8) и относящихся к нему правил формируется матрица мер сходства вариантов:

Обработка матрицы сходства шестью указанными методами позволяет получить шесть иерархических классификаций (дендрограмм). Анализ дендрограмм (рис. 5.5) показывает, что все ме­тоды, кроме метода максимальных значений, дают качественно сходные классификации. В то же время количественные значения уровней сходства у дендрограмм, построенных методами медианы и средней группы, существенно отличаются от дендрограмм, построенных другими методами. ­

При этом более верные резуль­таты дают методы медианы и средней группы. Действительно, пары объектов S5S7, S1S3, S2S4, S6S8 сходны между собой двумя альтернативами, а при наличии в объекте трех функциональных подсистем, реализуемых альтернативами, его сходство с любым другим объектом по двум альтернативам оценивается значением 0,67. Классы, образованные объектами S5—S7 и S1S3, а также S2S4 и S6S8, сходны между собой в среднем одной альтернати­вой, т. е. G(S5-7, S1-3) = G(S2-4, S6-8) = 0,5.

На вид дендрограммы влияет не только метод определения сход­ства между классами, но и порядок извлечения классов из матрицы сходства для тех случаев, когда указанные матрицы содержат несколь­ко одинаковых максимальных значений. В этих случаях возможны два способа извлечения классов из матрицы. Первый способ основан на случайном выборе двух классов, на пересечении которых в матри­це сходства стоит одно из максимальных значений. Второй способ предполагает осуществление одновременного выбора всех классов, имеющих максимальные значения в матрице сходства.

Наиболее распространен в практике кластерного анализа первый способ извлечения классов из матрицы. Таким образом, при нали­чии в матрице сходства не единственного максимального значения меры сходства анализируемых классов число дендрограмм, которое может быть построено на основе такой матрицы, также не равно единице. Примером является рассмотренная ранее матрица сход­ства, имеющая двенадцать пар классов с равным максимальным значением. Следовательно, для такой матрицы уже на первом шаге алгоритма построения иерархической классификации возможны двенадцать вариантов ее построения. При этом на последующих шагах обработки матрицы сходства также не исключена многова­риантность при выборе пары классов с максимальным значением. Альтернативная дендрограмма для рассматриваемой матрицы при­ведена на рис. 5.6. Она построена для случая, когда из матрицы сходства первой извлекалась пара S1 и S2.