При таком подходе к процедуре обучения может оказаться полезным геометрический анализ поверхности функции ошибок. Определим веса и смещения как свободные параметры модели и их общее число обозначим через N; каждому набору таких параметров поставим в соответствие одно измерение в виде ошибки сети. Тогда для всевозможных сочетаний весов и смещений соответствующую ошибку сети можно изобразить точкой в ЛЧ-1 – мерном пространстве, а все такие точки образуют некоторую поверхность, называемую поверхностью функции ошибок. При таком подходе цель обучения нейронной сети состоит в том, чтобы найти на этой многомерной поверхности глобальный минимум.
В случае линейной модели сети и функции ошибок в виде суммы квадратов такая поверхность будет представлять собой параболоид, который имеет единственный минимум, и это позволяет отыскать такой минимум достаточно просто.
В случае нелинейной модели поверхность ошибок имеет гораздо более сложное строение и обладает рядом неблагоприятных свойств, в частности может иметь локальные минимумы, плоские участки, седловые точки и длинные узкие овраги.
Определить глобальный минимум многомерной функции аналитически невозможно, и поэтому обучение нейронной сети, по сути дела, является процедурой изучения поверхности функции ошибок. Отталкиваясь от случайно выбранной точки на поверхности функции ошибок, алгоритм обучения постепенно отыскивает глобальный минимум. Как правило, для этого вычисляется градиент (наклон) функции ошибок в данной точке, а затем эта информация используется для продвижения вниз по склону. В конце концов алгоритм останавливается в некотором минимуме, который может оказаться лишь локальным минимумом, а если повезет, то и глобальным.
Таким образом, по существу алгоритмы обучения нейронных сетей аналогичны алгоритмам поиска глобального экстремума функции многих переменных.
Итак,преимущества нейросетевого подходазаключаются в следующем:
• параллелизм обработки информации;
• единый и эффективный принцип обучения;
• надежность функционирования;
• способность решать неформализованные задачи.
3. Моделирование динамики яркостной температуры методом инвариантных погружений и нейронных сетей
3.1 Получение экспериментальных данных на производственной практике
Одним из типов исследований методом радиометрического дистанционного зондирования земли является полевой эксперимент. Радиометрический комплекс установленный на агробиологической станции Омского Государственного Педагогического Университета состоит из трех радиометров частот 2,73Gh, 6,0Gh, 8,15Gh с соответственной длинной волны 11 см, 5 см и 3,6 см. (рис. 1, рис. 2), устанавливаемых на передвижном штативе (раме), передвижной лаборатории и 6 экспериментальных участков размером 1,4 м * 1,4 м (рис. 3).
Рис. 3. Схема передвижного штатива с радиометрами
Рис. 4. Передвижение рамы с радиометрами с одного участка на другой
Рис. 5. Экспериментальные участки
Конструкция и размеры передвижного штатива (рамы) были выбраны исходя из удовлетворения следующим критериям [1]:
1. Эталоны и исследуемые участки должны находиться в дальней зоне антенн радиометров
2. Ширина главного лепестка по уровню 0,5 дб должна быть меньше геометрических размеров, эталонов и участков.
3. Угол наклона антенн должен составлять 100
Участки №1, №2, №3, №4 являются экспериментальными участками, на которых расположены следующие виды почв: земля, загрязненная нефтью, песок, глина, чернозем, соответственно. На участке №5 расположен лист металла, а на участке №6 – емкость с водой. Участки №5 и №6 используются для калибровки оборудования, а измерения снятые с этих участков являются опорной точкой (калибровкой) для расчета яркостных температур почвы участков №1 – №4.
Штатив (рама) передвигается с одного на другой участок, измерения проводятся последовательно радиометрами с частотой 5 Gh, затем 11 Gh, затем 3,6 Gh.
При калибровке радиометров используются следующие эталоны излучения: излучения неба, отраженное металлическим листом, излучение гладкой водной поверхности, излучение поглощающего покрытия. Размеры эталонов должны превышать размеры пятна, излучающего в главный лепесток, чтобы дифракционными явлениями на краях образцов можно пренебречь.
В ходе эксперимента замерялись: время, температура окружающей среды, температура слоя почвы на глубине 0,5 см и 2 см, а также измерялась яркостная температура почв.
Дважды в день брались пробы почв на влажность: поверхностный слой 0–1 см, 1–2 см, и 3–4 см.
Исследуемыми объектами являлись участки №2 и №3, песчаная и глинистая почва соответственно (рис. 4; рис. 5).
Рис. 6. Песчаная почва. Участок №2
Рис. 7. Средний суглинок. Участок №3
Из полученных данных видно, что почти одинаковые в оптическом диапазоне почвы, кардинально отличаются по физическим свойствам.
Таблица 1. Гранулометрический состав почв (% от массы сухой почвы)
Размер фракций, мм | |||||||
Почва | 1–0,25 | 0,25–0,05 | 0,05–0,01 | 0,01–0,005 | 0,005–0,001 | <0,001 | <0,01 |
Песок(№2) | 36,1 | 43,4 | 11,4 | 5,5 | 1,4 | 0,9 | 1,3 |
Глина (№3) | 0,80 | 27,24 | 28,03 | 3,86 | 5,22 | 34,80 | 43,88 |
Был проведен цикл измерений в течении четырех дней яркостной температуры почвы «сухая-влажная-сухая». Цикл измерений состоит из 39 точек, для трех радиометров разной частоты (и соответственно разной глубины проникновения в почву). Измерения на участках проводятся между двумя опорными точками: калибровкой металлом и водой.
3.2 Постановка задачи. Поиск алгоритма решения
Задачей построенной нейронной сети должно быть восстановление параметров почв по экспериментальным данным значения яркостной температуры с радиометров различной частоты в момент экспериментального получения проб влажности почв.
Для моделирования методом Нейронных сетей используются несколько программ, среди них прикладной пакет для MathLab 6.1, StatisticaNeuralNetWorks, NNMath 3.1 и др. Будем использовать программы MathLab 6.1, StatisticaNeuralNetWorks, выбранные за простоту работы и возможности настройки нужной модели.
В общем случае, для получения алгоритмов и моделей выполняется следующее:
1. Определяется изучаемый класс объектов (представленный входными и выходными данными).
2. Для этого класса выбирается настраиваемая модель (модель, параметры которой можно изменить), удовлетворяющая определенным критериям и требованиям.
3. Выбирается оценка качества идентификации (потери, характеризующие различие между выходными величинами объекта и модели).
4. Формируется алгоритм идентификации, который, изменяя параметры модели, минимизирует потери.
Выбор и разработка моделей и алгоритмов требуют серьезных усилий для экспериментального исследования и сравнения с уже ранее предложенными. В то же время это предоставляет большую свободу в выборе направления в науке, знания которой будут привлекаться для создания новых моделей и алгоритмов.
Будем пользоваться двумя подходами в решении поставленной задачи:
1. Используем модель двухслойного персептрона, и поэтапно увеличиваем количество нейронов на каждом слое с 3 до 5, параметры которых оптимально подобраны в исследовании[15].
2. Функция автоматического подбора параметров, которая присутствует в программе StatisticaNeuralNetWorks и работает на основе анализа количества и вида входных и выходных данных.
Рис. 8. Двухслойный персептрон с одним скрытым слоем и 3 нейронами на каждом слое
Рис. 9. Двухслойный персептрон с одним скрытым слоем и 5 нейронами на каждом слое
Рис. 10.Нейронная сеть построенная методом автоматического подбора параметров
Радиометрическое исследование природной среды и восстановление требуемых параметров выполняется в работах. С учетом предлагаемой в рефракционной модели КДП почв связь между радиоизлучательной способностью почвогрунта и его КДП может быть разрешена в явном виде относительно объемной влажности. При этом решение содержит ряд априорно задаваемых параметров. Входными данными будут являться яркостные температуры, полученные при теоретическом расчете методом инвариантного погружения. Выходными данными являться параметры почв: объемная влажность, уровень слоя, и КДП почвы (при анализе которой можно определить класс почвы).
В решении поставленной задачи будем считать отсутствие как шума, создаваемого растительностью (т.к. участки в эксперименте были подготовлены и очищены от растительности), так и техногенного шума. При наличии же таковых, представляется возможным создание комплекса нейронных сетей, одни из которых будут отвечать за отчистку радиометрического сигнала от шумов, другая – решать основную задачу, в противном случае целесообразно использование вейвлет фильтров для отчистки сигнала.
3.3 Метод инвариантного погружения. Теоретический расчет. Режим обучения
Метод инвариантного погружения берет за основу слоистость почвы и различное влагосодержание в различных слоях почвы. Слоистая модель по Башаринову А.Е.
Данная модель содержит следующие допущения: