Упрощая, можно сказать, что процесс обучения является подгоночной процедурой для описания многопараметрической функцией (параметрами являются величины wij) упомянутого выше отображения пространства входных векторов на пространство выходных.
На эффективность работы и сходимость процесса обучения НС большое влияние оказывает правильный выбор входных сигналов. Они должны быть такими, чтобы в многомерном пространстве – пространстве признаков, образуемом ими, области с различными значениями выходных векторов разделялись как можно лучше.
Второй этап представляет собой непосредственную работу обученной НС по анализу физической информации.
4. Объясните смысл алгоритма обучения с учителем. Обучение НС может вестись с учителем или без учителя. В первом случае сети предъявляются значения как входных, так и желательных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей. Во втором случае выходы НС формируются самостоятельно, а веса изменяются по алгоритму, учитывающему только входные и производные от них сигналы.
Существует большое множество различных алгоритмов обучения, которые делятся на два больших класса: детерминистские и стохастические. В первом из них подстройка весов представляет собой жесткую последовательность действий, во втором -она производится на основе действий, подчиняющихся некоторому случайному процессу.
Рассмотрим алгоритм обучения с учителем.
Среди различных структур нейронных сетей одной из наиболее известных является многослойная структура, в которой каждый нейрон произвольного слоя связан со всеми аксонами нейронов предыдущего слоя или, в случае первого слоя, со всеми входами НС. Такие НС называются полносвязными. Когда в сети только один слой, алгоритм ее обучения с учителем довольно очевиден, так как правильные выходные состояния нейронов единственного слоя заведомо известны, и подстройка синаптических связей идет в направлении, минимизирующем ошибку на выходе сети. По этому принципу строится, например, алгоритм обучения однослойного персептрона.
Рассмотрим более подробно алгоритм обучения НС с учителем для однослойной нейронной сети, примером которой является однослойный перестрой.
1)Проинициализировать элементы весовой матрицы (обычно небольшими случайными значениями).
2)Подать на входы один из входных векторов, которые сеть должна научиться различать, и вычислить ее выход.
3)Если выход правильный, перейти на шаг 4.
Иначе вычислить разницу между идеальным уци полученным у значениями выхода:
Модифицировать веса в соответствии с формулой
где t и t+1 - номера соответственно текущей и следующей итераций; η - коэффициент скорости обучения, 0< η <1; i- номер входа; j - номер нейрона в слое.
Очевидно, что, если уц > у , весовые коэффициенты будут увеличены и тем самым уменьшат ошибку. В противном случае они будут уменьшены, и у тоже уменьшится, приближаясь к уц.
4) Цикл с шага 2, пока сеть не перестанет ошибаться.
На втором шаге на разных итерациях поочередно в случайном порядке предъявляются все возможные входные векторы. К сожалению, нельзя заранее определить число итераций, которые потребуется выполнить, а в некоторых случаях и гарантировать полный успех.
В многослойных же сетях оптимальные выходные значения нейронов всех слоев, кроме последнего, как правило, не известны, и двух- или более слойный персептрон уже невозможно обучить, руководствуясь только величинами ошибок на выходах НС. Один из вариантов решения этой проблемы - разработка наборов выходных сигналов, соответствующих входным, для каждого слоя НС, что, конечно, является очень трудоемкой операцией и не всегда осуществимо. Второй вариант - динамическая подстройка весовых коэффициентов синапсов, в ходе которой выбираются, как правило, наиболее слабые связи и изменяются на малую величину в ту или иную сторону, а сохраняются только те изменения, которые повлекли уменьшение ошибки на выходе всей сети. Очевидно. что данный метод "тыка", несмотря на свою кажущуюся простоту, требует громоздких рутинных вычислений. И, наконец, третий, более приемлемый вариант - распространение сигналов ошибки от выходов НС к ее входам, в направлении, обратном прямому распространению сигналов в обычном режиме работы. Этот алгоритм обучения НС получил название процедуры обратного распространения.
5. Что такое аппроксимация функции? Аппроксимация заключается в том, что используя имеющуюся информацию по f(x) можно рассмотреть другую функцию ?(x) близкую в некотором смысле к f(x), позволяющую выполнить над ней соответствующие операции и получить оценку погрешность такой замены.
?(х)- аппроксимирующая функция.
Под аппроксимацией обычно подразумевается описание некоторой, порой не заданной явно, зависимости или совокупности представляющих ее данных с помощью другой, обычно более простой или более единообразной зависимости. Часто данные находятся в виде отдельных узловых точек, координаты которых задаются таблицей данных.
Результат аппроксимации может не проходить через узловые точки. Напротив, задача интерполяции — найти данные в окрестности узловых точек. Для этого используются подходящие функции, значения которых в узловых точках совпадают с координатами этих точек.
6. Какие функции в среде МаtLab используются для создания нейронной сети? Функции создания новой сети.
* network - создание нейронной сети пользователя.
Запись:
net=network
net==nehvork(numlnputs, nutnLayers, biasConncct, inputCormect, layerConnect, outputConnect, targetConnect)
Описание. Функция возвращает созданную нейронную сеть с именем net и со следующими характеристиками (в скобках даны значения по умолчанию):
numlnputs– количество входов (0)
numLayers– количество слоев (0),
biasConnect- булевский вектор с числом элементов, равным количеству слоев (нули),
inputConnect– булевская матрица с числом строк, равным количеству слоев и числом строк, равным количеству входов (нули),
layerConnect– булевская матрица с числом строк и столбцов, равным количеству слоев (нули),
outputConnect– булевский вектор – строка с числом элементов, равным количеству слоев (нули),
targetConnect – вектор – строка, такая же как предыдущая.
* newc– создание конкурентного слоя
net=newc(PR, S, KLR, CLR) – функция создания слоя Кохонена.
Аргументы функции:
PR – Rx 2 матрица минимальных и максимальных значений для Rвходных элементов,
S — число нейронов,
KLR — коэффициент обучения Кохонена (по умолчанию 0.01)
CLR– коэффициент «справедливости» (по умолчанию 0.001).
* newcf- создание каскадной направленной сети
net=newcf(PR, [SIS2...SNI], {TF1 TF2...TFNI}, BTF, BLF, PF) – функция создания разновидности многослойной нейронной сети с обратным распространением ошибки – так называемой каскадной нейронной сети. Такая сеть содержит скрытых NIслоев, использует входные функции типа dotprodи netsum, инициализация сети осуществляется функциейinitnw.
Аргументы функции:
PR - Rx2 матрица минимальных и максимальных значений для R входных элементов,
Si– размер i – го скрытого слоя, для N1 слоев,
TFi– функция активации нейронов i – го слоя, по умолчанию 'tansig',
BTF– функция обучения сети, по умолчанию'trained',
BLF– функция настройки весов и смещения, по умолчанию 'learngdm',
PF– функция ошибки, по умолчанию 'mse'.
* newclm– создания сети обратного распространения Элмана (Elman)
net=neweIm(PR, [SIS2...SNI], {TFITF2...TFN1}, BTF, BLF, PF) – функция создания сети Элмана. Аргументы такие же, как и у предыдущей функции.
* newff– создание однонаправленной сети
net=newff(PR, [SIS2...SNI], {TFITF2...TFNI}, BTF, BLF, PF) – функция создания «классической» многослойной нейронной сети с обучением по методу обратного распространения ошибки.
* newfftd– создание однонаправленной сети с входными задержками
net=newfftd(PR, ID, [SIS2...SNI], {TFITF2...TFNI}, BTF, BLF,PF) – то же, что и предыдущая функция, но с наличием задержек по входам. Дополнительный аргумент ID – вектор входных задержек.
Заключение
В ходе выполнения данной лабораторной работы я построила и обучила нейронную сеть для аппроксимации таблично заданной функции
, i=1,20 в среде Matlab. Разработала программу, которая реализует нейросетевой алгоритм аппроксимации и выводит результаты аппроксимации в виде графиков.Для решения использовала функцию newff(.) – создание «классической» многослойной НС с обучением по методу обратного распространения ошибки.
Список использованных источников
1. О.С. Амосов
2. О.С. Амосов «Интеллектуальные информационные системы. Нейронные сети и нечеткие системы»: Учеб. Пособие. - Комсомольск-на-Амуре: ГОУВПО «КнАГТУ», 2004. -104 с.