⎜ e (2−3e +e ) −e (5−6e + e ) −e (1−3e + e ) ⎟
⎝ ⎠
⎡ 3 T ⎤
ε[ ]T = max ⎢m l l l T( 1, 2, ,3 )+ ∑∫mini k l l l Ti ( 1, 2, , ,3 τ τ)u di ⎥ =l=1 u≤1
⎣ i=1 0⎦
⎡ 3 T⎤
= max ⎢m l l l T( 1, 2, ,3 )+ ∑∫ k l l l Ti ( 1, 2, , ,3 τ) dτ⎥ ,l=1 ⎣ i=1 0 ⎦
где
m l l l T( 1, 2, ,3 ) = −( 4e−3T +8e−2T −3e−T )l1 +(2e−2T −e−T )l2 + −( 4e−3T + 6e−2T −e−T )l3 , k1 (l l l T1, 2, , ,3 τ) = −6e−3(T−τ) (l1 +l3 )−2e−(T−τ) (3l1 +l2 +l3 )+3e−2(T−τ) (4l1 +l2 +3l3 ),
k2 (l l l T1, 2, , ,3 τ) = e−3(T −τ) (l1 +l3 ),
k3 (l l l T1, 2, , ,3 τ) = −3e−3(T−τ) (l1 +l3 )+e−2(T −τ) (4l1 +l2 +3l3 ) .
Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле
Ui
t sign ki l l l T t t T i .В данном случае
⎛ 0.332184 ⎞
T 0 = 0.44738, L T0 ( 0 ) { }= l0 , l0 = −⎜⎜ 0.705538⎟⎟ .
⎜⎝ 0.625998 ⎟⎠
По теореме 2.4 каждая из компонент оптимального программного управления должна иметь не более трех переключений. Убедимся в этом, приведя графики их изменения на промежутке времени ⎡⎣0,T 0 ⎤⎦ .
u1 u1
1.5 1.5
1 0.5 | ||
0.1 0.2 0.3 0.4 | t -0.5 -1 | 0.1 0.2 0.3 0.4 |
1 0.5
t -0.5
-1
-1.5 -1.5
Рис. 4
На рис. 4 видно, что первая компонента оптимального программного управления переключается в момент времени t∗ = 0.426649, третья компонента – в момент времени t∗∗ = 308253, а вторая компонента остается все время постоянной.
Непосредственно проверяется, что для полученного закона движения x0 ( )t , t ∈⎡⎣0,T 0 ⎤⎦ выполняется
⎛−0.000568689⎞ ⎛ ⎞0
x0 (0.44738) = −⎜⎜ 0.000411838⎟⎟ ≈ ⎜ ⎟⎜ ⎟0 .
⎜⎝−0.000184312⎟⎠ ⎜ ⎟⎝ ⎠0
Таким образом, построенное управление U 0 (t) является оптимальным.
Ниже на рис. 5 приводится оптимальная траектория движения
Рис. 5.
Упражнения для самостоятельной работы
Для линейных управляемых динамических систем
x1 = −3x1 + 4x2 −6x3 +u1, x1 = −2x1 −4x2 −60x3 +u1, x2 = x1 −2x2 + 2x3 +u2, x2 = −4x1 − x2 −51x3 +u2,
а) x3 = 2x1 − x2 +3x3 +u3, б) x3 = 2x1 −2x2 + x3 +u3, t0 = 0, x10 = −1.43859, t0 = 0, x10 = 3.84645,
x20 = 0.580455, x30 =1.35472, x20 = 4.12477, x30 = −0.591971,
x1 = 2x1 + 4x2 −16x3 +u1, x1 = −3x1 − x2 −5x3 +u1, x2 = 2x1 − x2 + 21x3 +u2, x2 = x1 − x2 +u2,
в) x3 = −2x1 −2x2 + x3 +u3, г) x3 = x1 + x2 + 2x3 +u3, t0 = 0, x10 =15.3151, t0 = 0, x10 = −1.56927,
x20 = −11.9799, x30 = 3.9094 x20 = −0.473713, x30 =1.2287
решить задачу быстродействия. Рассмотреть два случая:
⎧⎛u1 ⎞⎫ ⎧⎛u1 ⎞ ⎫1) P = ⎨⎪⎜⎜u2 ⎟⎟∈R u312 +u22 +u32 =1⎪⎬, 2) P = ⎪⎨⎜⎜u2 ⎟⎟∈R3 ⎪⎬
⎪⎜⎝u3 ⎟⎠⎪⎭ ⎩⎪⎜⎝u3 ⎟⎠ ⎭⎪
⎩
Показать, что оптимальное время перехода в первом случае больше, чем во втором. Обосновать этот результат.
4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕ-
НИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ
4.1. Сведение задачи теории оптимального управления к функциональной проблеме моментов. Рассмотрим задачу теории оптимального управления, в которой θ0 ={ }t0 ,θ1 ={T}, S0 ={x0}, S1 ={xT }, P = Rr , а минимизируемый функционал имеет вид
T
I[u()⋅ ]= ∫ f0 (u( )τ )dτ. (1)
t0
Класс программных стратегий отождествим с множеством Lrp [t0 ,T] измеримых по Лебегу r -мерных вектор-функций U :[t T0, ]→ Rr , для которых функция
U ( )⋅ p , p∈[1,∞) суммируема на [t0 ,T] в смысле Лебега.Относительно минимизируемого функционала I дополнительно предположим:
1) для всех U ( )
L t T справедливо неравенство I U⎡⎣ ( )⋅ ⎤⎦ ≥ 0, причемI U⎡⎣ ( )⋅ ⎤⎦ = 0 тогда и только тогда, когда U t( ) = 0 почти всюду на [t0 ,T];
2) для всех U1 ( )
U2 ( ) L t T0 справедливо неравенствоI U⎡⎣ 1 (⋅)+U2 (⋅)⎤⎦ ≤ I U⎡⎣ 1 (⋅)⎦⎤ + I U⎡⎣ 2 (⋅)⎤⎦ ;
3) для всех U ( )⋅ ∈L t Trp [ 0, ] , λ∈R1 имеет место равенство
I ⎡⎣λU (⋅)⎤⎦ = λI U⎡⎣ (⋅)⎤⎦ .Условия 1)-3) позволяют истолковать функционал I как некоторую норму
на функциональном пространстве Lrp [t0 ,T].
Следуя [17], осуществим сведение задачи теории оптимального управления к функциональной проблеме моментов. Пусть U
L t T – некоторое программное управление, переводящее фазовый вектор из положения x0 в момент времени t0 в положение xT в момент времени T , и x( )⋅ = x(⋅,t x U0, 0, (⋅)). Тогда с учетом x( )T = xT по формуле Коши получимT T
xT = X T t[ , 0 ]x0 + ∫ X t[ ,τ]B( ) ( )τ τ τu d + ∫ X t[ ,τ τ τ] W ( )d . (2)
t0 t0
Введем обозначения
H T[ ,τ] = X T[ ,τ τ τ]B( ), ,t ∈[t T0, ],
T
c = xT − X[T,t0 ]x0 − ∫ X[t,τ]W( )τ dτ.
t0
Определение 1. Матрицу H[T,τ], t,τ∈[t0,T] будем называть переходной матрицей объекта.
Условие (2) перепишем с учетом введенных обозначений
T с = ∫ H[t,τ]u( )τ dτ.
t0
Пусть h(i) [t,τ τ] , ,t ∈[t T0, ] , i =1, ,n – строки переходной матрицы. Тогда последнее равенство в координатной форме имеет вид
T
сi = ∫ (h( )i [t,τ])T , U ( )τ τd , i =1, ,n. (3)t0
Вектор-функции h[ ]i ( )⋅ = (h( )i [T,⋅])T , i =1, ,n отождествим с элементами линейно-
го функционального пространства Lqr [t0,T], где 1 + 1 = 1. Такое предположениеp q
правомерно, так как функции h[i] (⋅), i =1, ,n непрерывны на [t0 ,T]. В дальнейшем это пространство функций будем называть основным для рассматриваемой задачи оптимального управления. Обозначим его символом Ω[t0 ,T].