7 Зв'язок методу динамічного програмування із принципом максимуму
Розглянемо задачу оптимального керування з фіксованими кінцями та вільним часом (6) з цільовим функціоналом
Оптимальне керування будемо вибирати серед кусково-неперервних вектор-функцій
що
Доведемо, що з рівняння (19) випливає існування деякого вектора
і нову функцію
де
Використовуючи ці позначення, перетворимо рівняння Беллмана. Очевидно, що
тому
Оскільки
Позначимо
Тоді формула (20) стає аналогом функції Понтрягіна
де
Це означає, що на оптимальному процесі
Доведемо, що спряжені змінні
Для цього припустимо, що функція Беллмана
Оскільки оптимальне керування
Продиференціюємо співвідношення (22):
Тоді відповідно до (23) для оптимального процесу дістанемо
Оскільки
то співвідношення (24) можна переписати у вигляді:
або, з урахуванням позначень (21),
Оскільки
а це, у свою чергу означає, що
Отже, встановлено теоретичний зв'язок принципу максимуму з методом динамічного програмування. Але на практиці виконати подібну операцію не завжди можливо. Так наприклад, рівняння (21) було отримано в припущенні, що функція Беллмана
Обидва методи придатні для задач, у яких відсутні обмеження на керування, і всі функції гладкі. Кожний з цих методів може бути застосований там, де не працює інший. Рівняння Беллмана вимагає більше припущень для застосування (неперервність і диференційованість функцій), а принцип максимуму складніше використовувати для розв’язання дискретних задач.