Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 32 из 49)

0 ~ n

Лемма 3. Пусть ρ > 0 . Тогда для любого hH величина lici , где l1, ,ln

i=1

– коэффициенты разложения (10), полностью определяется элементом h H и не зависит от конкретного вида разложения (10).

~

Доказательство. Допустим противное. Тогда найдется hH , для кото-

рого

n n n n

h = ∑li 'h[ ]i = ∑li ''h[ ]i , ∑li 'ci ≠ ∑li ''ci . (11)

i=1 i=1 i=1 i=1

Из условий (11) выводим, что

∑(li '−li '')h[ ]i = 0, ∑(li '−li '')ci ≠ 0 . (12) i=1 i=1

n Первое равенство в (12) разделим на величину ∑(li '−li '')ci ≠ 0. Имеем

i=1
n (li '−li '') [ ]ih = 0.

n i=1 ( )

l j '−l j '' c j

j=1 Обозначим

(l '−l '') li = n i i , i = 1, ,n .

∑(l j '−l j '')c j

j=1 n Тогда lici =1 и равенство (13) запишется в виде i=1 n nlih[ ]i = 0, ∑lici =1. i=1 i=1

(13)

n n

Последнее означает, что 0∈Q, а это противоречит условию ρ0 > 0 . Лемма доказана.

Теорема 2 (достаточные условия разрешимости проблемы моментов). Пусть ρ0 > 0 . Тогда проблема моментов имеет решение – функционал ϕ0 . При этом

0 ∗ 1

ϕ = 0 .

ρ

Доказательство. Определим функционал ϕ~: H~ R1 , положив

ϕ~[ ]h = ∑n lici , hH~ . (14)

i=1

Здесь li ,i =1, ,n – коэффициенты разложения (10). В силу леммы 3 функционал (14) определен однозначно. Кроме того, он линеен. Действительно, для всех

~ α,β∈R1, h,gH имеет место равенство ϕ~[αh + βg]=ϕ~⎡α∑n li[ ]h h[ ]i + β∑n li[ ]g h[ ]i =ϕ~⎡n

[ ] [ ] ci =

i=1 i=1 ⎦ ⎣ i=1 ⎦ i=1

n n

=α∑li[ ]h сi + β∑li[ ]g ci =αϕ~[ ]h + βϕ~[ ]g .

i=1 i=1

Выполнение равенств

ϕ~[h[i]]=ϕ~[0⋅h[ ]1 + +1⋅h[i] + + 0⋅h[n]]= ci , i =1, ,n.

для функционала ϕ~ очевидно.

Обозначим

l1 ⎞n

⎜ ⎟ ⎧⎫

l = ⎜ ⎟, L = ⎨llici =1⎬

⎜⎝ln ⎟⎠ ⎩i=1 ⎭

и вычислим норму функционала ϕ~ как линейного функционала, определенного

~ на линейном нормированном пространстве H . Имеем:

=

По следствию из теоремы Хана-Банаха [16 ] линейный функционал ϕ~

~ может быть продолжен с подпространства H на все пространство H без увеличения его нормы. Обозначим это продолжение через ϕ0 . Легко видеть, что для функционала ϕ0 выполнены условия (6), а величина его нормы совпадает с нижней оценкой из теоремы 1 для нормы функционала, решающего задачу 1. Следовательно, функционал ϕ0 является искомым. Теорема доказана. Теорема 3(принцип максимина). Пусть ϕ0 H – решение задачи 1, h0 Q

– «минимальный» элемент и G = ⎨ϕ∈H ϕ ⎬. Тогда

⎩⎭

ϕ0 (h0 )= maxϕ[h0 ].

ϕ∈G

Доказательство. Для всякого функционала ϕ∈G справедливо

ϕ(h0 ) ≤ ϕ ∗ h0 = 10 ⋅ρ0 =1. ρ

С другой стороны, в силу леммы 1 имеет место равенство ϕ(h 0 )=1. Теорема доказана.

Применим теоремы 1-3 к рассматриваемой линейной задаче теории оптимального управления. В результате получим следующее утверждение.

Теорема 4. Задача оптимального управления имеет решение тогда и только тогда, когда для r-мерной вектор-функции h0 (⋅), найденной из условия (7), где определяется формулой (5), а

n [ ]i

Q = ⎨h( )⋅ = l hi ( )⋅

lL,

i=1 ⎭

справедливо неравенство h = ρ0 > 0. При этом I
, и оптимальное

управление на минимальном элементе h0обладает свойством максимума

T T

h0 ( )τ , u 0 ( )τ
dτ= max ∫
h0 ( ) ( )τ , uτ
dτ. (15)

I

t0 ρ t0

Опираясь на утверждение теоремы 4, сформулируем правило решения задачи об оптимальном управлении.

На первом этапе следует посредством формулы (5) ввести норму на линейном пространстве r -мерных функций Ω[t0 ,T]. На втором – строится «минимальный» элемент h0 ()⋅ из условия (7), и на третьем – из условия (15) определяется оптимальное управление u0 (⋅).

4.2. Управляемость линейной динамической системы. Важной характеристикой динамической системы является ее управляемость. Определение 3. Линейная динамическая система

x = A t x( ) + B t u( ) (1)

называется вполне управляемой на промежутке времени [t T0, ], если для любых векторов x0,xT Rn существует такое программное управление u( )⋅ , что для него выполняется равенство

x(⋅,t x u0, 0, (⋅)) = xT .

Относительно системы (1) дополнительно предположим, что элементы матриц A t( ) и B( )t непрерывно дифференцируемы не менее чем n −1 раз по переменной t на промежутке времени [t T0, ]. Полагаем

d d

L t1 ( ) = B t( ), L2 ( )t = A t L t( ) 1 ( )−

L t1 ( ), ,Ln ( )t = A t L( ) n1 ( )t
Ln1 ( )t . dt dt

Сконструируем матрицу

K t( ) = (L t1 ( ), ,Ln (t))

размера n×(r n⋅ ).

Теорема 5. Пусть существует момент времени t∈[t T0, ] такой, что rang K t⎡⎣ ( )= n . Тогда система (1) вполне управляема на промежутке времени

[t T0, ].

Доказательство. Достаточно установить, что для всех cRn, c ≠ 0 спра-


ведливо неравенство

n

ρ0 ( )c =

h0 (c,⋅)
= minn l hi [ ]i ( )⋅

l ci i =1i=1

i=1

= minn

(X T[ ,⋅]B( )⋅ )T l
=