Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 13 из 49)

Пусть U 0 ( )⋅ - оптимальная программная стратегия. Обозначим через x0 ( )⋅ = x(⋅,t0,x U0, 0 ( )⋅ ) оптимальное движение объекта, а через ψ0 ( )⋅ - решение сопряженной системы дифференциальных уравнений (1.3.7), удовлетворяющее условию

.

Теорема 1 (принцип максимума Л.С. Понтрягина). Оптимальная программная стратегия U 0 ( )⋅ удовлетворяет следующему условию максимума:

B( )t U 0 (t),ψ0 (t)
= max
B t u( ) ,ψ0 (t)
(1)

u P

для почти всех t ∈[t T0, ].

Доказательство. Из выпуклости области достижимости G t( 0,x T0, ) в силу [7 ] следует, что для всех qG t( 0,x T0, ) имеет место неравенство

∂Φ 0 00 00 00

0 ≤(x ( )T ),q x ( )T = − ψ ( )T ,q x ( )T = ψ ( )T ,x ( )T − ψ ( )T ,q. (2)

x

Тогда для всех u( )⋅ ∈Π[t T0, ] должно выполняться

T T

ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( )U 0 ( )d + ∫ X T[ ,τ τ τ]C( )d

t0 t0

T T

− ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( ) ( )u d + ∫ X T[ ,τ τ τ]C( )d=

t0 t0

TT

= ψ ( )T ,∫ X T[ ,τ τ τ τ ψ]B( )U 0 ( )d 0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d≥ 0.

t0t0

Последнее возможно, только если

TT

ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( )U 0 ( )d= u( )⋅ ∈Πmax[t T0, ]ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d. (3)

t0t0

Последовательно преобразуем левую и правую части равенства (3). Имеем

T

ψ0 ( )T , X T[ ,τ τ τ τ]B( )U 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X T[ ,τ τ τ τ]B( ) ( )u d

( ) [ ]

t0

T

ψ0 ( )T , X 1 [τ,T B] ( )τ τ τU 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X 1 [τ,T B] ( ) ( )τ τ τud

( ) [ ]

t0

T

X [τ,T]}ψ0 ( )T , B( )τ τ τU 0 ( ) d = u( )⋅ ∈Πmax[t T0, ]{X 1 [τ ψ,T]}0 ( )T , B( ) ( )τ τ τud .

t0 0

Отсюда в силу (1.5.2) выводим

T T

∫ψ0 ( )τ τ τ τ, B( )U 0 ( )d = u( )⋅ ∈Πmax[t T0, ] ∫ψ τ τ τ τ0 ( ), B( ) ( )ud

t0 t0

В книге [18 ] показано, что

T T max ∫ψ0 ( )τ τ τ τ,B( ) ( )ud = ∫maxψ τ τ τ0 ( ), B( )u d .

u( )⋅ ∈Π[t T0, ]u Pt0 t0

Тогда

T

ψ τ τ τ0 ( ), B( )U 0 ( )
−maxu P∈ ψ τ τ τ0 ( ), B( )u d = 0,

t0

что и означает выполнение условия (1). Теорема доказана.

Функция

H t x u( , , ,ψ) =A t x( ) + B t u( ) +C t( ),ψ

представляет собой функцию Л.С. Понтрягина [25] для рассматриваемого управляемого динамического объекта. Таким образом, доказанная теорема утверждает, что на оптимальном управлении функция Л.С. Понтрягина достигает максимального значения.

Заметим, что для выпуклых функций Φ неравенство (2) является доста-

точным условием минимума функции Φ на множестве G t( 0,x T0, ). Тогда усло-

вие (1) будет не только необходимым, но и достаточным для оптимальности программной стратегии

U 0 (⋅).

Пример 1. Рассмотрим линейный управляемый динамический объект

x1u1 ⎞ ⎧⎪⎛u1 x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜ ⎟

u2 ⎠ ⎩⎪⎝u2 ⎠

x10 ⎞ ⎛ ⎞0

⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x =

x20 ⎠ ⎝ ⎠0

Рис. 1


Оптимальное управление объектом, как вид-

но из рис. 1, здесь состоит в том, чтобы перевести управляемую точку из на-

x10 (1)⎞ ⎛ ⎞1

чала координат в положение M÷⎜x20 ( )1 = ⎜ ⎟⎝ ⎠0 . Это можно осуществить только программной стратегией вида

U t u d t . (4)

⎝ 1 ⎠ 0

Проверим выполнение условий теоремы 1 для таких стратегий. Сопряженная система дифференциальных уравнений и граничные условия для нее здесь имеют вид

ψ1 = 0,ψ2 = 0,

x10 (1)

ψ1 ( )1 = −= 0,

(x10 ( )1 )2 +(x20 ( )1 −2)2

x20 ( )1 −2 ψ2 ( )1 = −=1.

(x10 ( )1 )2 +(x20 ( )1 −2)2

Интегрируя, находим, что

.

Выпишем функцию Л.С. Понтрягина, вычисленную вдоль оптимальной пары

(x0 ( )⋅ ,ψ0 ( )⋅ ). Имеем

H t x

t u t t u t u u t .

Отсюда следует, что

maxu PH t x( , 0 ( )t , ,uψ0 (t)) = u1max≤1,u2 ≤1(ψ10 (t u) 1 10 (t u) 2 ) = maxu2 ≤1 u2 =1, t∈[0,1]. (5)

Очевидно, что программное управление (4) доставляет максимум в (5) и, следовательно, удовлетворяет условию (1).

Практическое применение теоремы 1 для поиска решения задачи управления осуществляется следующим образом.

Для каждого фиксированной пары (t,ψ)∈[t T0, ]×Rn решается задача математического программирования

B(t)ψ, u
→ max, uP . (6)