Смекни!
smekni.com

Методические указания к выполнению лабораторных работ по дисциплине «Интеллектуальные информационные системы» Санкт-Петербург (стр. 5 из 10)

zk(X): mink//X - {X}k//.

В качестве векторной нормы могут быть использованы следующие известные нормы:

· евклидова норма //XiXki//Е = (Σi(XiXki)2)1/2;

· норма расстояния //XiXki//М = (Σi/XiXki/);

· норма Чебышева //XiXki//С = maxi/XiXki/.

В вычислительных процедурах иммунокомпьютинга в качестве аналога расстояния используется понятие энергии связи, основанное на сингулярном разложении матрицы. Энергия связи между объектами A и M представляется следующим образом:

ωi = - U Тi MVi, UiTUi = 1, ViT Vi = 1, i =1, ,r,

где Ui, Vi– соответственно, правые и левые сингулярные векторы

матрицы А, r –ранг матрицы.

Алгоритм вычислительной процедуры обучения с экспертом состоит их следующих шагов:

Шаг 1. Сворачивание вектора в матрицу. Заданный вектор Х размерности (n x 1) сворачиваем в матрицу M размерности nU x nV = n.

Шаг 2. Формируем матрицы A1, A2,….,Ak для эталонных классов с = 1,…,к и вычисляем их сингулярные векторы:

{U1, V1} – для A1, {U2, V2} - для A2, {Uк, Vк} - для Ak.

Шаг 3. Распознавание. Для каждого входного образа М вычисляем к значений энергии связи между каждой парой сингулярных векторов:

ω1 = - U Т1 MV1, ….., ωk = - U Тк MVк.

Шаг 4. Определяем класс, к которому принадлежит входной образ М. Минимальное значение энергии связи ω* определяет этот класс,:

c = ω* = minc { ωc }.

3.2. Лабораторная работа № 3

Цель работы: создание программного модуля для реализации вычислительной процедуры обучения с экспертом на основе инструментария универсальной системы MATLAB.

3.2.1. Порядок выполнения работы

1. Открыть универсальную систему MATLAB.

2. Задать обучающие матрицы Аi и матрицу М размерности (4 х 3).

3. Программно реализовать шаги 1-4 алгоритма вычислительной процедуры обучения с экспертом.

4. Сохранить все результаты выполнения работы в файле на диске.

3.2.2. Порядок оформления отчета

Отчетом о лабораторной работе № 3 является файл с именем, совпадающим с фамилией студента с результатами работы в папке Мои документы/номер группы.

3.2.3. Пример выполнения лабораторной работы №3

В соответствии с п. 2 формируем обучающие матрицы трех эталонных классов Аi ,i=1,2,3 размерности (4 х 3) и анализируемую матрицу М размерности (4 х 3).

Рисунок 14 Обучающие матрицы трёх эталонных классов.

Для сформированных обучающих эталонных матриц Аi, i=1,2,3 вычисляем первые левые и правые сингулярные векторы Ui, Vi, i=1,2,3.

Рисунок 15

Используя эти компоненты, вычисляем значения энергии связи анализируемой матрицы М с эталонными обучающими матрицами Аi

Рисунок 16

Из вычисленных значений энергии связи формируем множество W=[W11, W21, W31], минимальное значение которого определяет принадлежность анализируемого объекта к соответствующему классу.

Вывод: анализируемый объект относится к первому классу.

3.2.4. Контрольные вопросы

1. Что такое энергия связи?

2. Роль эксперта при реализации вычислительной процедуры обучения с экспертом.

3. Что является мерой близости выбранного образа М к конкретному классу?

4.

5.

6.

7.

8.

9.

10.

4. ВЫЧИСЛИТЕЛЬНАЯ ПРОЦЕДУРА ОБУЧЕНИЯ С ЭКСПЕРТОМ

4.1. Математическая формализация задачи

Отнесение различных векторов индикаторов к одному классу может рассматриваться как агрегация исходных данных, при этом геометрическая близость (расстояние) между объектами формализуется с помощью соответствующей векторной нормы. Наиболее распространенной является евклидова норма:

.

Следовательно, задача обучения сводится к разбиению пространства индикаторов на классы (т.е. к проведению классификации), а задача распознавания сводится к определению класса (т.е. к проведению кластеризации) zj={X}j, j=1,…,k с помощью выбранной векторной нормы:

.

Как известно, с помощью векторной нормы можно определить понятие расстояния между вектором и классом, а также понятие расстояния между классами.

С точки зрения распознавания образов полагается, что чем меньше значение выбранной нормы, тем сходство между объектами больше.

Определим образ как n-мерный вектор-столбец X=[x1, x2,…,xn], где x1, x2,…,xn являются вещественными числами, и индекс T является символом транспонирования матрицы.

Представим задачу распознавания образов как отображение f(X)→{1,…,c} любого образа X в одно из целых чисел 1,…,c, которые представляют классы.

Задача распознавания образов может быть сформулирована следующим образом:

Дано:

- Число классов c;

- набор из m обучающих образов: X1,….,Xm;;

- класс любого обучающего образа:f(X1)=c1…,f(Xm)=cm;

- произвольный n-мерный вектор P.

Найти:

Класс вектора P: f(P)=?.

Для реальных задач исходные данные в самом общем случае являются многомерными и допускают представление в виде массивов (векторов) вещественных и/или целых чисел. Как было отмечено выше, одной из основных особенностей ИК-алгоритма распознавания образов является проекция произвольных данных в пространство ФИС. Такое преобразование обладает следующими преимуществами:

- имеет строгое математическое обоснование в терминах сингулярного разложения матриц;

- существенно снижает размерность данных (до одно- двух- или трехмерного пространства ФИС);

- позволяет наглядно представить и визуализировать любую ситуацию как точку одно- двух- или трехмерного пространства.

Рассмотрим математическое описание основных процедур алгоритма иммунокомпьютинга.

4.2. Обучение

1. Сформировать обучающую матрицу A=[X1,…,Xm]T размерности n.

2. Вычислить максимальное сингулярное число s, а также левый и правый сингулярные векторы U и V обучающей матрицы по следующей итеративной (эволюционной) схеме:

до выполнения условия

3. Хранить сингулярное число s.

4. Хранить правый сингулярный вектор V как антитело-пробу.

5. Для всякого i=1,…,m хранить компоненту ui левого сингулярного вектора U (как клетку формальной иммунной сети) и класс ci, соответствующий обучающему образу Xi.

4.3. Распознавание

6. Для всякого n-мерного образа Z вычисляется энергия связи с V: