Очевидно, что набор
является допустимым, и при этомI∗ = lims→∞ I t T⎡⎣ 0s , s , x U0s , s ( )⋅ , xs ( )⋅ ⎦⎤ = lims→∞ Φ( t T0s , s ,x x0s , s (T s ))) = Φ( t T00, 0,x00, x0 (T 0 )) =
.Теорема доказана.
1.9. Область достижимости линейного управляемого динамического объекта. Важной характеристикой управляемого объекта является его область достижимости. Пусть t0 ∈θ0 , x0 ∈S0 (t0 ),T ∈θ1. Символом Π[t T0, ] обозначим множество всех допустимых программных стратегий вида U :[t T0, ]→ P.
Определение 11. Множество
G t( 0,x T0, ) ={q = x T t( , 0,x U0, ( )⋅)
U ( )⋅ ∈Π[t T0, ]} ⊂ Rnназывается областью достижимости управляемого динамического объекта в момент времени T для начального положения {t0, x0}.
Теорема 6. Пусть множество P ⊂ Rr выпукло и компактно. Тогда область достижимости является выпуклым компактным множеством в пространст-
ве Rn .
Доказательство. Из определения области достижимости для всякого q∈G t x T( 0, 0, ) следует существование программной стратегии U ( )⋅ ∈Π[t T0 , ] такой, что
T T
q = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )d + ∫ X T[ ,τ τ τ]C( )d , (1)
t0 t0
где X[s,t], s,t∈[t0,T]– фундаментальная матрица Коши, отвечающая однородному дифференциальному уравнению x = A(t)x, t∈[t0,T]. Оценим по норме вектор q . Имеем
T T
q ≤ X T t[ , 0 ] x0 + ∫ X T[ ,τ] B( )τ τ τU ( ) d + ∫ X T[ ,τ τ τ] C( ) d .t0 t0
В силу ограниченности множества P ⊂ Rn из последнего неравенства вытекает ограниченность области достижимости. Пусть q~ – предельная точка области достижимости и {q( )s } → q q, ( )s ∈G t( 0,x T0, ). Из равенства (1) следует, что для всех s =1,2, будет справедливо
T T
q( )s = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ U ( )s ( )τ τd + ∫ X T[ ,τ τ τ]C( )d , (2)
t0 t0
где U (s) ( )⋅ ∈Π[t T0, ]. В силу слабой компактности множества Π[t T0, ] [16 ] из последовательности функций {U ( )s ( )⋅ } можно извлечь подпоследовательность, слабо сходящуюся к функции U (⋅ ∈Π) [t T0 , ]. Переходя к пределу по подходящей подпоследовательности индексов в (2), получаем равенство
T T
q∗ = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )d + ∫ X [T,τ]C( )τ τd . (3)
t0 t0
Равенство (3) означает, что q∗ ∈G t x T( 0, 0, ). Отсюда следует замкнутость области достижимости. Докажем ее выпуклость. Пусть q( )1 ,q( )2 ∈ ∈G t x T( 0, 0, ). Это означает, что существуют функции U (1) (⋅),U (2) (⋅ ∈Π) [t T0, ], для которых справедливы равенства
T T
q( )i = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )i ( )d +∫ X T[ ,τ τ τ]C( )d , i =1,2. (4)
t0 t0
Для любого α∈[0,1] положим qα =αq(1) + (1−α)q(2) . В силу (1) имеем
T T
α 0 0 ∫ X [T,τ] B( )τ α τ⎣⎡ U ( )1 ( ) (+ 1−α)U ( )2 ( )τ τ⎤⎦d + ∫ X T[ ,τ τ τ]C( )d . (5)
q = X T t[ , ]x +
t0 t0
Из выпуклости множества P следует, что α τU (1) ( )+(1−α)U (2) ( )τ ∈P для всех
τ∈[t T0, ] . Это означает справедливость включения
αU (1) ( ) (⋅ + 1−α)U (2) (⋅ ∈Π) [t T0, ]. Тогда в силу (5) заключаем, что qα∈G t x T( 0, 0, ). Таким образом, область достижимости выпукла. Теорема доказана.
Упражнения для самостоятельной работы
Даны дифференциальные уравнения движения управляемых линейных динамических объектов
x1 = −3x1 + 4x2 − 6x3 + u1, x1 = −2x1 − 4x2 − 60x3 + u1,
а) x2 = x1 − 2x2 + 2x3 + u2, б) x2 = −4x1 − x2 −51x3 + u2, x3 = 2x1 − x2 + 3x3 + u3, x3 = 2x1 − 2x2 + x3 + u3,
x1 = 2x1 + 4x2 −16x3 + u1, x1 = −3x1 − x2 −5x3 +u1,
в) x2 = 2x1 − x2 + 21x3 + u2, г) x2 = x1 − x2 +u2, x3 = −2x1 − 2x2 + x3 + u3, x3 = x1 + x2 + 2x3 +u3.
1. Записать дифференциальные уравнения движения в матричной форме.
2. Для однородных систем линейных дифференциальных уравнений, соответствующих заданным неоднородным системам, построить фундаментальную матрицу Коши двумя способами: с использованием операции обращения матрицы и без использования. Убедиться в том, что оба метода строят одну и ту же матрицу. Проверить выполнение свойств (3.1)-(3.4) фундаментальной матрицы Коши.
3. Проверить справедливость формулы Коши (5.1) при следующих дополнительных данных:
⎛ ⎞1 ⎛−1⎞
⎜ ⎟ ⎜ ⎟
x =
а) 0 ⎜ ⎟⎜ ⎟⎝ ⎠11 , t0 = 0,T =1, б) x0 = ⎜⎝⎜−11⎟⎠⎟, t0 = 0,T =1,
u1 ( )t = sin ,t u2 ( )t = cos ,t u3 ( )t = et , u1 ( )t = t u, 2 ( )t = e−t , u3 ( )t = cos ,t
⎛ 1 ⎞ ⎛−1⎞
⎜ ⎟ ⎜ ⎟
в) x0 = −⎜⎜⎝ 11⎟⎠, t0 = 0,T =1, г) x0 = −⎜⎜⎝ 11⎠⎟⎟, t0 = 0,T =1,
⎟
u1 ( )t = sin ,t u2 ( )t = t2, u3 ( )t = et , u1 ( )t = e ut , 2 ( )t = sin ,t u3 ( )t = −cos .t
4. Вычислить критерии оптимальности для движений, отвечающих указанным в пункте 3 задания управлениям и выходящих из приведенных там же начальных положений
I u⎡⎣ ( )⋅ ⎤⎦ = I u⎡⎣ (⋅)⎤⎦ =
а)
б)I u⎡⎣ ( )⋅ ⎤⎦ = I u⎡⎣ (⋅)⎤⎦ =
в)
г)2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ
ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАННЫМ
ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА
2.1. Случай закрепленного левого конца и свободного правого конца траектории. Рассматривается следующая задача теории оптимального управления.
Задача 1. Найти допустимую программную стратегию U 0 ( )⋅ ∈Π[t T0, ], доставляющую минимум функционалу
I ⎡⎣U (⋅)⎤⎦ = Φ(x T( )), Φ∈C1(R1)
при ограничениях
x = A t x( ) + B t u( ) +C t( ), x∈Rn, u∈P ⊂ Rr , θ0 ={t0},θ1 ={T}, S0 ={x0}, S1 = Rn ,
где множество P ⊂ Rn является выпуклым компактом.
По теореме 1.6 область достижимости G t( 0,x T0, ) является компактом в пространстве Rn . Тогда в силу непрерывности функции Φ решение задачи 1 существует.