Как правило, качество подобного рода классических оценок гарантируется лишь асимптотически при выборках большого объема. В случае же малых выборок приложение результатов асимптотической теории представляется недостаточно обоснованным. А при обучении системы диагностики желательно в среднем обойтись именно малыми выборками. К тому же, классический подход практически не использует ту априорную информацию о возможных зданиях
в, которая всегда в какой-то степени имеется. Поэтому вероятностная модель, построенная на классических оценках, будет в нашем случае не полностью адекватной реальности. Действительно, результаты испытаний на заводе-изготовителе объекта, как правило, уже дают некоторого априорную информацию о начальных значениях, тенденции изменения и диапазоне изменения неизвестного параметра .Преимущества, которые дает байесовский подход к решению задачи обучения системы диагностики.
a) Байесовский подход может применяться к любым вариантам и частным случаям задачи обучения.
b) При нем не возникает сложного вопроса о выборе необходимых оценок неизвестного параметра и доверительных интервалов, как в классической выборочной теории.
c) Он позволяет довольно просто использовать последовательный анализ результатов обучения, что в классическом подходе очень сложно, а зачастую невозможно.
d) Если практическая проверка применяемой байесовской модели процесса обучения покажет ее некоторую неадекватность, то она легко может быть изменена так, чтобы устранить указанное несоответствие. Причем изменения делаются в рамках самого байесовского подхода.
e) При байесовском подходе могут быть выделены так называемые обновляющие процессы, по изменению характеристик которых можно очень оперативно в ходе самого обучения проверить степень адекватности выбранной вероятностной модели к действительности. В математической статистике подобная процедура носит название анализ остатков (residuals).
f) В случае если априорной информации очень мало, априорное распределение неизвестного параметра все равно может достаточно обоснованно быть выбранным в классе так называемых неинформативных априорных распределений.
g) Если же априорной информации достаточно для формирования априорного распределения, то выбор его в соответствующем классе сопряженных распределений очень упрощает все необходимые вычисления и снижает саму размерность задачи.
2.3 Общее решение задачи определения оптимального момента перехода на статистическую диагностику
Обратная индукция – чтобы приблизить задачу к практике, напомним, что
может рассматриваться как , поскольку жизненный цикл ОД конечен, хотя можно получить решение задачи и для случая , когда может быть . Но в этом на практике просто нет необходимости.Обозначим
класс всех моментов остановки , таких, что , и определимСчитаем, что
существует для всех . Придерживаясь предыдущей терминологии, скажем, что момент оптимален в , если и .Для решения задачи вычисления
и интегрируемой стохастической последовательности текущих выигрышей от бучения системы диагностики воспользуемся следующим «вложением», характерным для динамического программирования. Пусть для каждого обозначает множество всех моментов остановки , таких, что .Заметим, что
и . Теперь покажем, как в найти оптимальный момент остановки (т.е. момент перехода на статистическую диагностику). Если , то задача тривиальна, так как является единственным правилом остановки в , и поэтому . Для интуитивно ясно, что следует сравнить с и использовать правилоЭти рассуждения мотивируют следующую теорему динамического программирования, которая формализует принцип обратной индукции.
Пусть
– фиксированное положительное целое число. Определим последовательность , полагая (2.1)Пусть для каждого
равно первому , такому, что . (2.2)Тогда
иследовательно,
Чтобы определить оптимальный момент
перехода на статистические методы, необходимо согласно (2.2) уметь как-то определять . Методологически это довольно просто делается по рекуррентному уравнению (2.1). Однако реализовать (2.1) в непосредственном виде на ЭВМ можно лишь в плоском случае, т.е. когда достаточная статистика вполне описывается лишь двумя числовыми гиперпараметрами и сама история диагноза одномерна (т.е. сводится только к записи значений контролируемой величины). Но в случае большой размерности истории диагноза и в случае многомерности вектора гиперпараметров соотношение (2.1) реализовать на ЭВМ просто невозможно. Поэтому надо иметь какой-то другой метод получения удовлетворительного решения задачи. Далее рассмотрим такой метод.