zk(X): mink//X - {X}k//.
В качестве векторной нормы могут быть использованы следующие известные нормы:
· евклидова норма //Xi – Xki//Е = (Σi(Xi – Xki)2)1/2;
· норма расстояния //Xi – Xki//М = (Σi/Xi – Xki/);
· норма Чебышева //Xi – Xki//С = maxi/Xi – Xki/.
В вычислительных процедурах иммунокомпьютинга в качестве аналога расстояния используется понятие энергии связи, основанное на сингулярном разложении матрицы. Энергия связи между объектами A и M представляется следующим образом:
ωi = - U Тi MVi, UiTUi = 1, ViT Vi = 1, i =1, ,r,
где Ui, Vi– соответственно, правые и левые сингулярные векторы
матрицы А, r –ранг матрицы.
Алгоритм вычислительной процедуры обучения с экспертом состоит их следующих шагов:
Шаг 1. Сворачивание вектора в матрицу. Заданный вектор Х размерности (n x 1) сворачиваем в матрицу M размерности nU x nV = n.
Шаг 2. Формируем матрицы A1, A2,….,Ak для эталонных классов с = 1,…,к и вычисляем их сингулярные векторы:
{U1, V1} – для A1, {U2, V2} - для A2, {Uк, Vк} - для Ak.
Шаг 3. Распознавание. Для каждого входного образа М вычисляем к значений энергии связи между каждой парой сингулярных векторов:
ω1 = - U Т1 MV1, ….., ωk = - U Тк MVк.
Шаг 4. Определяем класс, к которому принадлежит входной образ М. Минимальное значение энергии связи ω* определяет этот класс,:
c = ω* = minc { ωc }.
Цель работы: создание программного модуля для реализации вычислительной процедуры обучения с экспертом на основе инструментария универсальной системы MATLAB.
1. Открыть универсальную систему MATLAB.
2. Задать обучающие матрицы Аi и матрицу М размерности (4 х 3).
3. Программно реализовать шаги 1-4 алгоритма вычислительной процедуры обучения с экспертом.
4. Сохранить все результаты выполнения работы в файле на диске.
Отчетом о лабораторной работе № 3 является файл с именем, совпадающим с фамилией студента с результатами работы в папке Мои документы/номер группы.
В соответствии с п. 2 формируем обучающие матрицы трех эталонных классов Аi ,i=1,2,3 размерности (4 х 3) и анализируемую матрицу М размерности (4 х 3).
Рисунок 14 Обучающие матрицы трёх эталонных классов.
Для сформированных обучающих эталонных матриц Аi, i=1,2,3 вычисляем первые левые и правые сингулярные векторы Ui, Vi, i=1,2,3.
Рисунок 15
Используя эти компоненты, вычисляем значения энергии связи анализируемой матрицы М с эталонными обучающими матрицами Аi
Рисунок 16
Из вычисленных значений энергии связи формируем множество W=[W11, W21, W31], минимальное значение которого определяет принадлежность анализируемого объекта к соответствующему классу.
Вывод: анализируемый объект относится к первому классу.
1. Что такое энергия связи?
2. Роль эксперта при реализации вычислительной процедуры обучения с экспертом.
3. Что является мерой близости выбранного образа М к конкретному классу?
4.
5.
6.
7.
8.
9.
10.
4. ВЫЧИСЛИТЕЛЬНАЯ ПРОЦЕДУРА ОБУЧЕНИЯ С ЭКСПЕРТОМ
Отнесение различных векторов индикаторов к одному классу может рассматриваться как агрегация исходных данных, при этом геометрическая близость (расстояние) между объектами формализуется с помощью соответствующей векторной нормы. Наиболее распространенной является евклидова норма:
.
Следовательно, задача обучения сводится к разбиению пространства индикаторов на классы (т.е. к проведению классификации), а задача распознавания сводится к определению класса (т.е. к проведению кластеризации) zj={X}j, j=1,…,k с помощью выбранной векторной нормы:
.
Как известно, с помощью векторной нормы можно определить понятие расстояния между вектором и классом, а также понятие расстояния между классами.
С точки зрения распознавания образов полагается, что чем меньше значение выбранной нормы, тем сходство между объектами больше.
Определим образ как n-мерный вектор-столбец X=[x1, x2,…,xn], где x1, x2,…,xn являются вещественными числами, и индекс T является символом транспонирования матрицы.
Представим задачу распознавания образов как отображение f(X)→{1,…,c} любого образа X в одно из целых чисел 1,…,c, которые представляют классы.
Задача распознавания образов может быть сформулирована следующим образом:
Дано:
- Число классов c;
- набор из m обучающих образов: X1,….,Xm;;
- класс любого обучающего образа:f(X1)=c1…,f(Xm)=cm;
- произвольный n-мерный вектор P.
Найти:
Класс вектора P: f(P)=?.
Для реальных задач исходные данные в самом общем случае являются многомерными и допускают представление в виде массивов (векторов) вещественных и/или целых чисел. Как было отмечено выше, одной из основных особенностей ИК-алгоритма распознавания образов является проекция произвольных данных в пространство ФИС. Такое преобразование обладает следующими преимуществами:
- имеет строгое математическое обоснование в терминах сингулярного разложения матриц;
- существенно снижает размерность данных (до одно- двух- или трехмерного пространства ФИС);
- позволяет наглядно представить и визуализировать любую ситуацию как точку одно- двух- или трехмерного пространства.
Рассмотрим математическое описание основных процедур алгоритма иммунокомпьютинга.
1. Сформировать обучающую матрицу A=[X1,…,Xm]T размерности m×n.
2. Вычислить максимальное сингулярное число s, а также левый и правый сингулярные векторы U и V обучающей матрицы по следующей итеративной (эволюционной) схеме:
до выполнения условия
3. Хранить сингулярное число s.
4. Хранить правый сингулярный вектор V как антитело-пробу.
5. Для всякого i=1,…,m хранить компоненту ui левого сингулярного вектора U (как клетку формальной иммунной сети) и класс ci, соответствующий обучающему образу Xi.
6. Для всякого n-мерного образа Z вычисляется энергия связи с V: