Смекни!
smekni.com

Психологическая интуиция искусственных нейронных сетей (стр. 5 из 18)

Имеется некоторое множество наблюдений, которые относятся к p различных классов. Требуется, используя информацию об этих наблюдениях и их классификациях, найти такое правило, с помощью которого можно было бы с минимальным количеством ошибок классифицировать вновь появляющиеся наблюдения.

Наблюдение задается вектором x, а его классификация - числом

(
).

Таким образом, требуется, имея последовательность из l наблюдений и классификаций

построить такое решающее правило
, которое с возможно меньшим числом ошибок классифицировало бы новые наблюдения.

Для формализации термина «ошибка» принимается предположение о том, что существует некоторое правило

, определяющее для каждого вектора x классификацию
, которая называется «истинной». Ошибкой классификации вектора x с помощью правила
называется такая классификация, при которой
и
не совпадают.

Далее предполагается, что в пространстве векторов x существует неизвестная нам вероятностная мера (обозначаемая плотность

). В соответствии с
случайно и независимо появляются ситуации x, которые классифицируются с помощью правила
. Таким образом определяется обучающая последовательность
.

Качество решающего правила

записывается в виде
, где
.

Проблема следовательно заключается в построении решающего правила

таким образом, чтобы минимизировать функционал
.

Сходной с задачей распознавания образов является задача восстановления регрессии, предпосылки к которой формулируются следующим образом:

Два множества элементов связаны функциональной зависимостью, если каждому элементу x может быть поставлен в соответствие элемент y. Эта зависимость называется функцией, если множество x - векторы, а множество y - скаляры. Однако существуют и такие зависимости, где каждому вектору x ставится в зависимость число y, полученное с помощью случайного испытания, согласно условной плотности

. Иначе говоря, каждому x ставится в соответствие закон
, согласно которому в случайном испытании реализуется выбор y.

Существование таких связей отражает наличие стохастических зависимостей между вектором x и скаляром и скаляром y. Полное знание стохастической зависимости требует восстановления условной плотности

, однако, данная задача весьма трудна и на практике (например, в задачах обработки результатов измерения) может быть сужена до задачи определения функции условного математического ожидания. Эта суженная задача формулируется следующим образом: определить функцию условного математического ожидания, то есть функцию, которая каждому x ставит в соответствие число y(x), равное математическому ожиданию скаляра y:
. Функция y(x) называется функцией регрессии, а задача восстановления функции условного математического ожидания - задачей восстановления регрессии.

Строгая постановка задачи такова:

В некоторой среде, характеризующейся плотностью распределения вероятности P(x), случайно и независимо появляются ситуации x. В этой среде функционирует преобразователь, который каждому вектору x ставит в соответствие число y, полученное в результате реализации случайного испытания, согласно закону

. Свойства среды P(x) и закон
неизвестны, однако известно, что существует регрессия
. Требуется по случайной независимой выборке пар
восстановить регрессию, то есть в классе функций
отыскать функцию
, наиболее близкую к регрессии
.

Задача восстановления регрессии является одной из основных задач прикладной статистики. К ней приводится проблема интерпретации прямых экспериментов.

Задача решается в следующих предположениях:

–Искомая закономерность связывает функциональной зависимостью величину y с вектором x:

.

–Целью исследования является определение зависимости

в ситуации, когда в любой точке x может быть проведен прямой эксперимент по определению этой зависимости, то есть проведены прямые измерения величины
. Однако вследствие несовершенства эксперимента результат измерения определит истинную величину с некоторой случайной ошибкой, то есть в каждой точке x удается определить не величину
, а величину
, где
- ошибка эксперимента,
.

–Ни в одной точке x условия эксперимента не допускают систематической ошибки, то есть математическое ожидание измерения

функции в каждой фиксированной точке равно значению функции
в этой точке:
.

–Случайные величины

и
независимы.

В этих условиях необходимо по конечному числу прямых экспериментов восстановить функцию

. Требуемая зависимость есть регрессия, а суть проблемы состоит в отыскании регрессии по последовательности пар
.

Задача восстановления регрессии принято сводить к проблеме минимизации функционала

на множестве
(интегрируемых с квадратом по мере
функций) в ситуации, когда плотность
неизвестна, но зато задана случайная и независимая выборка пар
.

1.6 алгоритмы и методы безусловной оптимизации

Как было показано в предыдущем параграфе данной главы, решение основных задач восстановления зависимостей достигается при помощи процедуры оптимизации функционала качества.

Ее решение будет рассмотрено в подходах задачи безусловной минимизации гладкой функции

[77].

Данная задача непосредственно связана с условиями существования экстремума в точке:

* Необходимое условие первого порядка. Точка

называется локальным минимумом
на
, если найдется
для
. Согласно теореме Ферма если
- точка минимума
на
и
дифференцируема в
, то
.