Пусть U 0 ( )⋅ - оптимальная программная стратегия. Обозначим через x0 ( )⋅ = x(⋅,t0,x U0, 0 ( )⋅ ) оптимальное движение объекта, а через ψ0 ( )⋅ - решение сопряженной системы дифференциальных уравнений (1.3.7), удовлетворяющее условию
.Теорема 1 (принцип максимума Л.С. Понтрягина). Оптимальная программная стратегия U 0 ( )⋅ удовлетворяет следующему условию максимума:
B( )t U 0 (t),ψ0 (t) = max B t u( ) ,ψ0 (t) (1)
u P∈
для почти всех t ∈[t T0, ].
Доказательство. Из выпуклости области достижимости G t( 0,x T0, ) в силу [7 ] следует, что для всех q∈G t( 0,x T0, ) имеет место неравенство
∂Φ 0 00 00 00 0 ≤(x ( )T ),q − x ( )T = − ψ ( )T ,q − x ( )T = ψ ( )T ,x ( )T − ψ ( )T ,q. (2)∂x
Тогда для всех u( )⋅ ∈Π[t T0, ] должно выполняться
T Tψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( )U 0 ( )d + ∫ X T[ ,τ τ τ]C( )d−
t0 t0
T T
− ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( ) ( )u d + ∫ X T[ ,τ τ τ]C( )d=
t0 t0
TT
= ψ ( )T ,∫ X T[ ,τ τ τ τ ψ]B( )U 0 ( )d − 0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d≥ 0.t0t0
Последнее возможно, только если
TTψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( )U 0 ( )d= u( )⋅ ∈Πmax[t T0, ]ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d. (3)
t0t0
Последовательно преобразуем левую и правую части равенства (3). Имеем
T
ψ0 ( )T , X T[ ,τ τ τ τ]B( )U 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X T[ ,τ τ τ τ]B( ) ( )u d ⇒( ) [ ]
t0
T
ψ0 ( )T , X −1 [τ,T B] ( )τ τ τU 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X −1 [τ,T B] ( ) ( )τ τ τud ⇒
( ) [ ]
t0
T
∫ X [τ,T]}Tрψ0 ( )T , B( )τ τ τU 0 ( ) d = u( )⋅ ∈Πmax[t T0, ]{X −1 [τ ψ,T]}Tр 0 ( )T , B( ) ( )τ τ τud .t0 0
Отсюда в силу (1.5.2) выводим
T T
∫ψ0 ( )τ τ τ τ, B( )U 0 ( )d = u( )⋅ ∈Πmax[t T0, ] ∫ψ τ τ τ τ0 ( ), B( ) ( )udt0 t0
В книге [18 ] показано, что
T T max ∫ψ0 ( )τ τ τ τ,B( ) ( )ud = ∫maxψ τ τ τ0 ( ), B( )u d .u( )⋅ ∈Π[t T0, ]u P∈ t0 t0
Тогда
T
∫ ⎡⎣ ψ τ τ τ0 ( ), B( )U 0 ( ) −maxu P∈ ψ τ τ τ0 ( ), B( )u ⎤⎦d = 0,t0
что и означает выполнение условия (1). Теорема доказана.Функция
H t x u( , , ,ψ) =A t x( ) + B t u( ) +C t( ),ψ
представляет собой функцию Л.С. Понтрягина [25] для рассматриваемого управляемого динамического объекта. Таким образом, доказанная теорема утверждает, что на оптимальном управлении функция Л.С. Понтрягина достигает максимального значения.
Заметим, что для выпуклых функций Φ неравенство (2) является доста-
точным условием минимума функции Φ на множестве G t( 0,x T0, ). Тогда усло-
вие (1) будет не только необходимым, но и достаточным для оптимальности программной стратегииU 0 (⋅).
Пример 1. Рассмотрим линейный управляемый динамический объектx1 ⎛u1 ⎞ ⎧⎪⎛u1 ⎞ x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜ ⎟
⎝u2 ⎠ ⎩⎪⎝u2 ⎠
⎛ x10 ⎞ ⎛ ⎞0
⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x =
⎝ x20 ⎠ ⎝ ⎠0
Рис. 1
Оптимальное управление объектом, как вид-
но из рис. 1, здесь состоит в том, чтобы перевести управляемую точку из на-
⎛ x10 (1)⎞ ⎛ ⎞1
чала координат в положение M∗ ÷⎜⎜⎝ x20 ( )1 ⎠⎟⎟ = ⎜ ⎟⎝ ⎠0 . Это можно осуществить только программной стратегией видаU t u d t . (4)
⎝ 1 ⎠ 0
Проверим выполнение условий теоремы 1 для таких стратегий. Сопряженная система дифференциальных уравнений и граничные условия для нее здесь имеют вид
ψ1 = 0,ψ2 = 0,
x10 (1)
ψ1 ( )1 = −= 0,
(x10 ( )1 )2 +(x20 ( )1 −2)2
x20 ( )1 −2 ψ2 ( )1 = −=1.(x10 ( )1 )2 +(x20 ( )1 −2)2
Интегрируя, находим, что
.Выпишем функцию Л.С. Понтрягина, вычисленную вдоль оптимальной пары
(x0 ( )⋅ ,ψ0 ( )⋅ ). Имеем
H t x
t u t t u t u u t .Отсюда следует, что
maxu P∈ H t x( , 0 ( )t , ,uψ0 (t)) = u1max≤1,u2 ≤1(ψ10 (t u) 1 +ψ10 (t u) 2 ) = maxu2 ≤1 u2 =1, t∈[0,1]. (5)Очевидно, что программное управление (4) доставляет максимум в (5) и, следовательно, удовлетворяет условию (1).
Практическое применение теоремы 1 для поиска решения задачи управления осуществляется следующим образом.
Для каждого фиксированной пары (t,ψ)∈[t T0, ]×Rn решается задача математического программирования
BTр (t)ψ, u → max, u∈P . (6)