Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 12 из 49)

Очевидно, что набор

является допустимым, и при этом

I= lims→∞ I t T0s , s , x U0s , s ( )⋅ , xs ( )⋅ ⎤ = lims→∞ Φ( t T0s , s ,x x0s , s (T s ))) = Φ( t T00, 0,x00, x0 (T 0 )) =

.

Теорема доказана.

1.9. Область достижимости линейного управляемого динамического объекта. Важной характеристикой управляемого объекта является его область достижимости. Пусть t0 ∈θ0 , x0 S0 (t0 ),T ∈θ1. Символом Π[t T0, ] обозначим множество всех допустимых программных стратегий вида U :[t T0, ]→ P.

Определение 11. Множество

G t( 0,x T0, ) ={q = x T t( , 0,x U0, ( )⋅)

U ( )⋅ ∈Π[t T0, ]} ⊂ Rn

называется областью достижимости управляемого динамического объекта в момент времени T для начального положения {t0, x0}.

Теорема 6. Пусть множество P Rr выпукло и компактно. Тогда область достижимости является выпуклым компактным множеством в пространст-

ве Rn .

Доказательство. Из определения области достижимости для всякого qG t x T( 0, 0, ) следует существование программной стратегии U ( )⋅ ∈Π[t T0 , ] такой, что

T T

q = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )d + ∫ X T[ ,τ τ τ]C( )d , (1)

t0 t0

где X[s,t], s,t∈[t0,T]– фундаментальная матрица Коши, отвечающая однородному дифференциальному уравнению x = A(t)x, t∈[t0,T]. Оценим по норме вектор q . Имеем

T T

q X T t[ , 0 ] x0 + ∫ X T[ ,τ] B( )τ τ τU ( ) d + ∫
X T[ ,τ τ τ] C( ) d .

t0 t0

В силу ограниченности множества P Rn из последнего неравенства вытекает ограниченность области достижимости. Пусть q~ – предельная точка области достижимости и {q( )s } → q q, ( )s G t( 0,x T0, ). Из равенства (1) следует, что для всех s =1,2, будет справедливо

T T

q( )s = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ U ( )s ( )τ τd + ∫ X T[ ,τ τ τ]C( )d , (2)

t0 t0

где U (s) ( )⋅ ∈Π[t T0, ]. В силу слабой компактности множества Π[t T0, ] [16 ] из последовательности функций {U ( )s ( )⋅ } можно извлечь подпоследовательность, слабо сходящуюся к функции U (⋅ ∈Π) [t T0 , ]. Переходя к пределу по подходящей подпоследовательности индексов в (2), получаем равенство

T T

q= X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )d + ∫ X [T,τ]C( )τ τd . (3)

t0 t0

Равенство (3) означает, что qG t x T( 0, 0, ). Отсюда следует замкнутость области достижимости. Докажем ее выпуклость. Пусть q( )1 ,q( )2 ∈ ∈G t x T( 0, 0, ). Это означает, что существуют функции U (1) (⋅),U (2) (⋅ ∈Π) [t T0, ], для которых справедливы равенства

T T

q( )i = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )i ( )d +∫ X T[ ,τ τ τ]C( )d , i =1,2. (4)

t0 t0

Для любого α∈[0,1] положим qα q(1) + (1−α)q(2) . В силу (1) имеем

T T

α 0 0 X [T,τ] B( )τ α τU ( )1 ( ) (+ 1−α)U ( )2 ( )τ τ⎤d + ∫ X T[ ,τ τ τ]C( )d . (5)

q = X T t[ , ]x +

t0 t0

Из выпуклости множества P следует, что α τU (1) ( )+(1−α)U (2) ( )τ ∈P для всех

τ∈[t T0, ] . Это означает справедливость включения

αU (1) ( ) (⋅ + 1−α)U (2) (⋅ ∈Π) [t T0, ]. Тогда в силу (5) заключаем, что qαG t x T( 0, 0, ). Таким образом, область достижимости выпукла. Теорема доказана.

Упражнения для самостоятельной работы

Даны дифференциальные уравнения движения управляемых линейных динамических объектов

x1 = −3x1 + 4x2 − 6x3 + u1, x1 = −2x1 − 4x2 − 60x3 + u1,

а) x2 = x1 − 2x2 + 2x3 + u2, б) x2 = −4x1 x2 −51x3 + u2, x3 = 2x1 x2 + 3x3 + u3, x3 = 2x1 − 2x2 + x3 + u3,

x1 = 2x1 + 4x2 −16x3 + u1, x1 = −3x1 x2 −5x3 +u1,

в) x2 = 2x1 x2 + 21x3 + u2, г) x2 = x1 x2 +u2, x3 = −2x1 − 2x2 + x3 + u3, x3 = x1 + x2 + 2x3 +u3.

1. Записать дифференциальные уравнения движения в матричной форме.

2. Для однородных систем линейных дифференциальных уравнений, соответствующих заданным неоднородным системам, построить фундаментальную матрицу Коши двумя способами: с использованием операции обращения матрицы и без использования. Убедиться в том, что оба метода строят одну и ту же матрицу. Проверить выполнение свойств (3.1)-(3.4) фундаментальной матрицы Коши.

3. Проверить справедливость формулы Коши (5.1) при следующих дополнительных данных:

⎛ ⎞1 ⎛−1⎞

⎜ ⎟ ⎜ ⎟

x =

а) 0 ⎜ ⎟⎜ ⎟⎝ ⎠11 , t0 = 0,T =1, б) x0 = ⎜⎝⎜−11⎟⎠⎟, t0 = 0,T =1,

u1 ( )t = sin ,t u2 ( )t = cos ,t u3 ( )t = et , u1 ( )t = t u, 2 ( )t = et , u3 ( )t = cos ,t

⎛ 1 ⎞ ⎛−1⎞

⎜ ⎟ ⎜ ⎟

в) x0 = −⎜⎜⎝ 11⎟⎠, t0 = 0,T =1, г) x0 = −⎜⎜⎝ 11⎠⎟⎟, t0 = 0,T =1,

u1 ( )t = sin ,t u2 ( )t = t2, u3 ( )t = et , u1 ( )t = e ut , 2 ( )t = sin ,t u3 ( )t = −cos .t

4. Вычислить критерии оптимальности для движений, отвечающих указанным в пункте 3 задания управлениям и выходящих из приведенных там же начальных положений

I u⎡⎣ ( )⋅ ⎤⎦ = I u⎡⎣ (⋅)⎤⎦ =

а)

б)

I u⎡⎣ ( )⋅ ⎤⎦ = I u⎡⎣ (⋅)⎤⎦ =

в)

г)

2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ

ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАННЫМ

ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА

2.1. Случай закрепленного левого конца и свободного правого конца траектории. Рассматривается следующая задача теории оптимального управления.

Задача 1. Найти допустимую программную стратегию U 0 ( )⋅ ∈Π[t T0, ], доставляющую минимум функционалу

I U (⋅)⎤= Φ(x T( )), Φ∈C1(R1)

при ограничениях

x = A t x( ) + B t u( ) +C t( ), xRn, uP Rr , θ0 ={t0},θ1 ={T}, S0 ={x0}, S1 = Rn ,

где множество P Rn является выпуклым компактом.

По теореме 1.6 область достижимости G t( 0,x T0, ) является компактом в пространстве Rn . Тогда в силу непрерывности функции Φ решение задачи 1 существует.