Пусть U 0 ( )⋅ - оптимальная программная стратегия. Обозначим через x0 ( )⋅ = x(⋅,t0,x U0, 0 ( )⋅ ) оптимальное движение объекта, а через ψ0 ( )⋅ - решение сопряженной системы дифференциальных уравнений (1.3.7), удовлетворяющее условию
Теорема 1 (принцип максимума Л.С. Понтрягина). Оптимальная программная стратегия U 0 ( )⋅ удовлетворяет следующему условию максимума:
u P∈
для почти всех t ∈[t T0, ].
Доказательство. Из выпуклости области достижимости G t( 0,x T0, ) в силу [7 ] следует, что для всех q∈G t( 0,x T0, ) имеет место неравенство
∂x
Тогда для всех u( )⋅ ∈Π[t T0, ] должно выполняться
ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( )U 0 ( )d + ∫ X T[ ,τ τ τ]C( )d−
t0 t0
T T
− ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( ) ( )u d + ∫ X T[ ,τ τ τ]C( )d=
t0 t0
TT
t0t0
Последнее возможно, только если
ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( )U 0 ( )d= u( )⋅ ∈Πmax[t T0, ]ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d. (3)
t0t0
Последовательно преобразуем левую и правую части равенства (3). Имеем
T
( ) [ ]
t0
T
ψ0 ( )T , X −1 [τ,T B] ( )τ τ τU 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X −1 [τ,T B] ( ) ( )τ τ τud ⇒
( ) [ ]
t0
T
t0 0
Отсюда в силу (1.5.2) выводим
T T
t0 t0
В книге [18 ] показано, что
u( )⋅ ∈Π[t T0, ]u P∈ t0 t0
Тогда
T
t0
Функция
H t x u( , , ,ψ) =A t x( ) + B t u( ) +C t( ),ψ
представляет собой функцию Л.С. Понтрягина [25] для рассматриваемого управляемого динамического объекта. Таким образом, доказанная теорема утверждает, что на оптимальном управлении функция Л.С. Понтрягина достигает максимального значения.
Заметим, что для выпуклых функций Φ неравенство (2) является доста-
точным условием минимума функции Φ на множестве G t( 0,x T0, ). Тогда усло-
U 0 (⋅).
x1 ⎛u1 ⎞ ⎧⎪⎛u1 ⎞ x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜ ⎟
⎝u2 ⎠ ⎩⎪⎝u2 ⎠
⎛ x10 ⎞ ⎛ ⎞0
⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x =
⎝ x20 ⎠ ⎝ ⎠0
Рис. 1
Оптимальное управление объектом, как вид-
но из рис. 1, здесь состоит в том, чтобы перевести управляемую точку из на-
⎛ x10 (1)⎞ ⎛ ⎞1
U t u d t . (4)
⎝ 1 ⎠ 0
Проверим выполнение условий теоремы 1 для таких стратегий. Сопряженная система дифференциальных уравнений и граничные условия для нее здесь имеют вид
ψ1 = 0,ψ2 = 0,
x10 (1)
ψ1 ( )1 = −= 0,
(x10 ( )1 )2 +(x20 ( )1 −2)2
(x10 ( )1 )2 +(x20 ( )1 −2)2
Интегрируя, находим, что
Выпишем функцию Л.С. Понтрягина, вычисленную вдоль оптимальной пары
(x0 ( )⋅ ,ψ0 ( )⋅ ). Имеем
H t x
Отсюда следует, что
Очевидно, что программное управление (4) доставляет максимум в (5) и, следовательно, удовлетворяет условию (1).
Практическое применение теоремы 1 для поиска решения задачи управления осуществляется следующим образом.
Для каждого фиксированной пары (t,ψ)∈[t T0, ]×Rn решается задача математического программирования