7 Зв'язок методу динамічного програмування із принципом максимуму
Розглянемо задачу оптимального керування з фіксованими кінцями та вільним часом (6) з цільовим функціоналом
, і крайовими умовами , . Вважатимемо, що час невідомий.Оптимальне керування будемо вибирати серед кусково-неперервних вектор-функцій
. За принципом динамічного програмування для оптимального процесу існує такий розв’язок рівняння Беллмана ,(19)що
– значення, на якому досягається мінімум у лівій частині рівняння (19).Доведемо, що з рівняння (19) випливає існування деякого вектора
, який задовольняє співвідношенням принципу максимуму. Нехай – функція Беллмана, що відповідає оптимальному процесу . Розглянемо нову зміннуі нову функцію
,де
.Використовуючи ці позначення, перетворимо рівняння Беллмана. Очевидно, що
, , ,тому
Оскільки
, то останнє співвідношення можна привести до вигляду: .(20)Позначимо
, .Тоді формула (20) стає аналогом функції Понтрягіна
,де
.Це означає, що на оптимальному процесі
функція Понтрягіна набуває максимального значення, рівного 0. Очевидно, що функція Понтрягіна не залежить від , тому що і , не залежать від .Доведемо, що спряжені змінні
задовольняють спряженій системі , .(21)Для цього припустимо, що функція Беллмана
має неперервні частинні похідні другого порядку. Позначимо .(22)Оскільки оптимальне керування
однозначно визначає оптимальну траєкторію , то функція досягає на кожному фіксованому по змінній максимального значення, рівного 0, у точці , що відповідає оптимальному керуванню в цій точці. У цьому випадку для функції в будь-який момент часу для процесу буде виконана умова , , .(23)Продиференціюємо співвідношення (22):
, .Тоді відповідно до (23) для оптимального процесу дістанемо
, .(24)Оскільки
,то співвідношення (24) можна переписати у вигляді:
,або, з урахуванням позначень (21),
, .Оскільки
, то ,а це, у свою чергу означає, що
, .Отже, встановлено теоретичний зв'язок принципу максимуму з методом динамічного програмування. Але на практиці виконати подібну операцію не завжди можливо. Так наприклад, рівняння (21) було отримано в припущенні, що функція Беллмана
має неперервні похідні другого порядку, що не завжди виконується.Обидва методи придатні для задач, у яких відсутні обмеження на керування, і всі функції гладкі. Кожний з цих методів може бути застосований там, де не працює інший. Рівняння Беллмана вимагає більше припущень для застосування (неперервність і диференційованість функцій), а принцип максимуму складніше використовувати для розв’язання дискретних задач.