МЕТОД ДИНАМІЧНОГО ПРОГРАМУВАННЯ
1 Принцип оптимальності
Оптимальне керування в будь-який момент часу не залежить від передісторії процесу і визначається тільки станом системи в поточний момент і метою керування. Якщо в якийсь період часу керування було неоптимальним, то наслідки цього в майбутньому виправити вже не можна. Під метою керування розуміються вимоги, яким повинна задовольняти керована система, наприклад, це може бути приведення системи в заданий стан або забезпечення певних умов руху протягом заданого періоду часу.
Отже, принцип оптимальності характеризує наступний за заданим станом рух системи, але він може не мати місця для траєкторії, що передує цьому стану.
2 Метод динамічного програмування
Розглянемо застосування методу динамічного програмування до розв’язання неперервних задач оптимального керування. У цьому випадку треба виконати дискретизацію початкової задачі, тобто початкову задачу потрібно замінити близькою їй дискретною задачею. Розглянемо динамічну систему, закон руху якої описується автономним диференціальним рівнянням
де
Припустимо, що початковий стан системи
Для дискретизації неперервної задачі (1) – (2) розіб'ємо відрізок
кожний, де
З останнього співвідношення випливає, що
Інтегральному цільовому функціоналу (2) відповідає інтегральна сума
Отже, ми перейшли до дискретної задачі, у якій потрібно знайти такі керування
Розглянемо співвідношення
де
Величина
і залежить від стану
Відповідно до принципу оптимальності, керування
Далі будемо розглядати лише задачі, у яких зазначений мінімум досягається в єдиній точці.
На наступному етапі визначимо керування
де
а
– керування, що залежить від стану, у якому перебуває система. Отже, на передостанньому відрізку часу знайдене оптимальне керування як функція від стану
Повторюючи цю процедуру, на
де
відповідно до (3). Співвідношення (5) називаються рекурентними співвідношеннями Беллмана.
Після того, як на останньому етапі буде знайдено значення
Наведений алгоритм розв’язання задачі оптимального керування методом динамічного програмування можна перенести на загальний випадок задачі керування з векторним законом руху (1), тобто якщо
3 Принцип оптимальності для задачі оптимального керування з фіксованим часом і вільним правим кінцем
Розглянемо автономну систему
з цільовим функціоналом
у якому початковий і кінцевий моменти часу
Починаючи з будь-якого моменту часу
Відносно початкового відрізка оптимальної траєкторії до точки