Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 30 из 49)

e (2−3e +e ) −e (5−6e + e ) −e (1−3e + e ) ⎟

⎝ ⎠

⎡ 3 T

ε[ ]T = max ⎢m l l l T( 1, 2, ,3 )+ ∑∫mini k l l l Ti ( 1, 2, , ,3 τ τ)u di ⎥ =

l=1 u≤1

i=1 0

⎡ 3 T

= max ⎢m l l l T( 1, 2, ,3 )+ ∑∫ k l l l Ti ( 1, 2, , ,3 τ)
dτ,

l=1 ⎣ i=1 0

где

m l l l T( 1, 2, ,3 ) = −( 4e−3T +8e−2T −3eT )l1 +(2e−2T eT )l2 + −( 4e−3T + 6e−2T eT )l3 , k1 (l l l T1, 2, , ,3 τ) = −6e−3(T−τ) (l1 +l3 )−2e−(T−τ) (3l1 +l2 +l3 )+3e−2(T−τ) (4l1 +l2 +3l3 ),

k2 (l l l T1, 2, , ,3 τ) = e−3(T −τ) (l1 +l3 ),

k3 (l l l T1, 2, , ,3 τ) = −3e−3(T−τ) (l1 +l3 )+e−2(T −τ) (4l1 +l2 +3l3 ) .

Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле

Ui

t sign ki l l l T t t T i .

В данном случае

⎛ 0.332184 ⎞

T 0 = 0.44738, L T0 ( 0 ) { }= l0 , l0 = −0.705538 .

⎝ 0.625998

По теореме 2.4 каждая из компонент оптимального программного управления должна иметь не более трех переключений. Убедимся в этом, приведя графики их изменения на промежутке времени 0,T 0 .

u1 u1

1.5 1.5

1

0.5

0.1 0.2 0.3 0.4

t

-0.5

-1

0.1 0.2 0.3 0.4

1 0.5

t -0.5

-1

-1.5 -1.5

Рис. 4

На рис. 4 видно, что первая компонента оптимального программного управления переключается в момент времени t= 0.426649, третья компонента – в момент времени t∗∗ = 308253, а вторая компонента остается все время постоянной.

Непосредственно проверяется, что для полученного закона движения x0 ( )t , t ∈⎡0,T 0 выполняется

⎛−0.000568689⎞ ⎛ ⎞0

x0 (0.44738) = −0.000411838⎜ ⎟⎜ ⎟0 .

⎜⎝−0.000184312⎟⎠ ⎜ ⎟⎝ ⎠0

Таким образом, построенное управление U 0 (t) является оптимальным.

Ниже на рис. 5 приводится оптимальная траектория движения

Рис. 5.

Упражнения для самостоятельной работы

Для линейных управляемых динамических систем

x1 = −3x1 + 4x2 −6x3 +u1, x1 = −2x1 −4x2 −60x3 +u1, x2 = x1 −2x2 + 2x3 +u2, x2 = −4x1 x2 −51x3 +u2,

а) x3 = 2x1 x2 +3x3 +u3, б) x3 = 2x1 −2x2 + x3 +u3, t0 = 0, x10 = −1.43859, t0 = 0, x10 = 3.84645,

x20 = 0.580455, x30 =1.35472, x20 = 4.12477, x30 = −0.591971,

x1 = 2x1 + 4x2 −16x3 +u1, x1 = −3x1 x2 −5x3 +u1, x2 = 2x1 x2 + 21x3 +u2, x2 = x1 x2 +u2,

в) x3 = −2x1 −2x2 + x3 +u3, г) x3 = x1 + x2 + 2x3 +u3, t0 = 0, x10 =15.3151, t0 = 0, x10 = −1.56927,

x20 = −11.9799, x30 = 3.9094 x20 = −0.473713, x30 =1.2287

решить задачу быстродействия. Рассмотреть два случая:

⎧⎛u1 ⎞⎫ ⎧⎛u1 ⎞ ⎫

1) P = ⎨⎪⎜⎜u2 ⎟⎟∈R u312 +u22 +u32 =1⎪⎬, 2) P = ⎪⎨⎜⎜u2 ⎟⎟∈R3 ⎪⎬

⎪⎜⎝u3 ⎟⎠⎪⎭ ⎩⎪⎜⎝u3 ⎟⎠ ⎭⎪

Показать, что оптимальное время перехода в первом случае больше, чем во втором. Обосновать этот результат.


4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕ-

НИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ

4.1. Сведение задачи теории оптимального управления к функциональной проблеме моментов. Рассмотрим задачу теории оптимального управления, в которой θ0 ={ }t0 1 ={T}, S0 ={x0}, S1 ={xT }, P = Rr , а минимизируемый функционал имеет вид

T

I[u()⋅ ]= ∫ f0 (u( )τ )dτ. (1)

t0

Класс программных стратегий отождествим с множеством Lrp [t0 ,T] измеримых по Лебегу r -мерных вектор-функций U :[t T0, ]→ Rr , для которых функция

U ( )p , p∈[1,∞) суммируема на [t0 ,T] в смысле Лебега.

Относительно минимизируемого функционала I дополнительно предположим:

1) для всех U ( )

L t T справедливо неравенство I U⎡⎣ ( )⋅ ⎤≥ 0, причем

I U⎡⎣ ( )⋅ ⎤= 0 тогда и только тогда, когда U t( ) = 0 почти всюду на [t0 ,T];

2) для всех U1 ( )

U2 ( ) L t T0 справедливо неравенство

I U1 (⋅)+U2 (⋅)⎤I U1 (⋅)⎤ + I U2 (⋅)⎤;

3) для всех U ( )⋅ ∈L t Trp [ 0, ] , λ∈R1 имеет место равенство

I λU (⋅)⎤= λI U(⋅)⎤.

Условия 1)-3) позволяют истолковать функционал I как некоторую норму

на функциональном пространстве Lrp [t0 ,T].

Следуя [17], осуществим сведение задачи теории оптимального управления к функциональной проблеме моментов. Пусть U

L t T – некоторое программное управление, переводящее фазовый вектор из положения x0 в момент времени t0 в положение xT в момент времени T , и x( )⋅ = x(⋅,t x U0, 0, (⋅)). Тогда с учетом x( )T = xT по формуле Коши получим

T T

xT = X T t[ , 0 ]x0 + ∫ X t[ ,τ]B( ) ( )τ τ τu d + ∫ X t[ ,τ τ τ] W ( )d . (2)

t0 t0

Введем обозначения

H T[ ,τ] = X T[ ,τ τ τ]B( ), ,t ∈[t T0, ],

T

c = xT X[T,t0 ]x0 − ∫ X[t,τ]W( )τ dτ.

t0

Определение 1. Матрицу H[T,τ], t,τ∈[t0,T] будем называть переходной матрицей объекта.

Условие (2) перепишем с учетом введенных обозначений

T с = ∫ H[t,τ]u( )τ dτ.

t0

Пусть h(i) [t,τ τ] , ,t ∈[t T0, ] , i =1, ,n – строки переходной матрицы. Тогда последнее равенство в координатной форме имеет вид

T

сi =
(h( )i [t])T , U ( )τ τd , i =1, ,n. (3)

t0

Вектор-функции h[ ]i ( )⋅ = (h( )i [T,⋅])T , i =1, ,n отождествим с элементами линейно-

го функционального пространства Lqr [t0,T], где 1 + 1 = 1. Такое предположение

p q

правомерно, так как функции h[i] (⋅), i =1, ,n непрерывны на [t0 ,T]. В дальнейшем это пространство функций будем называть основным для рассматриваемой задачи оптимального управления. Обозначим его символом Ω[t0 ,T].