Пример 5*. Рассматривается следующая управляемая динамическая система
x1 = 2x1 +9x2 +u1, ⎧⎪⎛u1 ⎞22 2 ⎫⎪, u∈P = ⎨⎜ ⎟∈R u1 +u2 ≤1⎬, t∈[0,1],
x2 = x1 + 2x2 +u2 ⎪⎩⎝u2 ⎠⎪⎭
⎧⎪⎛ m1 ⎞⎫⎪M = ⎨⎜ ⎟≤1⎬, k = n = 2, x1 (0) = x2 ( )0 = 0.
⎪⎩⎝m2 ⎠⎪⎭
Фундаментальная матрица Коши для однородной системы дифференциальных уравнений здесь имеет вид
⎛ 12 e−(t−τ) (1+e6(t−τ) ) 32 e−(t−τ) (− +1 e6(t−τ) )⎞
X t[ ,τ] = ⎜⎜⎜ ⎟⎟⎟ .
⎝
⎠Вычислим опорную функцию χ(M,⋅)терминального множества M . Име-
ем
ml1 1 + m l2 2 →
.Обозначим n1 = m1 −50, n2 = m2 −12. Тогда
n2 n2
(n1 +50)l1 +(n2 +12)l2 = nl1 1 + n l2 2 +50l1 +30l2 → max,
.Отсюда выводим
2 2 ⎛l ⎞ 2
χ(M,l) = 4l +9l +50l +30l l, = ∈R .Выражение ε( )l здесь принимает вид
T ε( )l = −max m l, 0 + X T t[ , 0 ]x∗, l0 + ∫minu P∈t0
+ ⎜
⎝⎝l2 ⎠
X T[ ,τ τ τ]B( ) ( )u , l0
= 3 e−(1(−1τ−τ) )(− +1 e6 1( −τ) )⎟⎞⎛ ⎞⎜ ⎟0 , ⎛⎜l1 ⎞⎟+2
12 e− (1+e6 1( −τ) ) ⎟⎠⎟⎝ ⎠0 ⎝l2 ⎠
⎛u1 ⎞ ⎜
⎝u ⎠ )⎝
1
= −4l +9l +50l1 +30l2 − ⎢⎣ 2
0 ⎣
2
+⎡⎣ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+e6 1( −τ) )l2 ⎤⎦ ⎤⎥⎦ dτ=,
где обозначено
2
Ε(τ, ,l l1 2 ) = ⎢⎣⎡⎣⎡ 12 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 ⎦⎤ +2
+⎡ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+e6 1( −τ) )l2 ⎤⎦ ⎤⎥⎦ . ⎣
Функция Uˆ , доставляющая минимум в выражении (8), определяется формулой
⎛ 1 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 ⎞
2
⎜−
⎟ˆ ( , ) = ⎜⎜ Ε(τ, ,l l1 2 ) ⎟⎟. (12)
U t l
⎜ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l2 ⎟
⎜−
⎟⎜⎝ Ε(τ, ,l l1 2 ) ⎟⎠
Задача математического программирования (10) формулируется следующим образом:
. Ее решение в силу равенства l2 = ± 1−l12 сводится к проблеме максимизации функции одного переменного l1 ∈ −[ 1,1]. Максимум целевой функции и вектор, на котором этот максимум достигается, соответственно имеют вид0
0 0 0 ⎛l1 ⎞ ⎛−0.316⎞
ε ε= ( )l =11.874 > 0, l = ⎜ 0 ⎟ = ⎜ ⎟.
⎝l2 ⎠ ⎝−0.949⎠
Подставляя l0 в (12,) находим управление
⎛ 1 e−(1−τ) (1+e6 1( −τ) )l10 + 16 e−(1−τ) (− +1 e6 1( −τl) )l20 ⎞
2
⎜−
⎟⎜ Ε(τ,l l10, 20 ) ⎟
U 0 ( )t = ⎜ ⎟,
⎜ 3 e−(1−τ) (− +1 e6 1( −τ) )l10 + 12 e−(1−τ) (1+e6 1( −τ) )l20 ⎟
2
⎜ −
⎟⎜⎝ Ε(τ,l l10, 20 ) ⎟⎠
удовлетворяющее необходимым условиям оптимальности.
Подставим это управление в исходное дифференциальное уравнение и проинтегрируем полученное уравнение с заданными начальными условиями.
Ниже на рис. 8 приводятся графики изменения фазовых координат по времени для найденного закона движения объекта
Рис. 8
Вычислим координаты фазового вектора в конечный момент времени и финальное расстояние от него до целевого множества
0 ⎛ x10 ( )1 ⎞ ⎛45.817⎞ 0 0
x ( )1 = ⎜⎜ x20 ( )1 ⎠⎟⎟ = ⎜⎝15.805⎟⎠, I U⎡⎣ ( )⋅ ⎤⎦ = ρ(x ( )1 ,M ) =11.874. ⎝
Непосредственно убеждаемся в справедливости равенства
ε ε0 = (l0 ) = I U⎡⎣ 0 (⋅)⎤⎦ .
Таким образом, стратегия U 0 является оптимальной стратегией, а отвечающая ей траектория движения объекта – оптимальной траекторией. Для сравнения вычислим финальное расстояние от фазового вектора до терминального множества в случае, когда в качестве допустимого программного управления взята вектор- функция
⎛ 12 e−(1−τ) (1+e6 1( −τ) )l10 + 16 e−(1−τ) (− +1 e6 1( −τl) )l20 −0.5⎞ ⎜−
⎟⎜ Ε1 (τ,l10,l20 ) ⎟ u t( ) = ⎜ ⎟,
⎜ 23 e−(1−τ) (− +1 e6 1( −τ) )l10 + 12 e−(1−τ) (1+e6 1( −τ) )l20 + 0.5 ⎟ ⎜ −
⎟⎜⎝ Ε1 (τ,l10,l20 ) ⎟⎠
где
Ε1 (τ, ,l l1 2 ) = ⎡⎡ 12 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 −0.5⎤2 +
⎢⎣⎣ ⎦
2
+⎡⎣ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l2 + 0.5⎤⎦ ⎤⎦⎥ .
Пусть x( )⋅ = x(⋅,t0,x V0. ( )⋅ ). Тогда
⎛ x1 ( )1 ⎞ ⎛45.878⎞
⎜ x2 ( )1 ⎟⎠ = ⎜⎝ ⎟, I u⎡⎣ ( )⋅ ⎤ =⎦ 11.923.
⎝ 15.733⎠
Таким образом,
I u⎡⎣ ( )⋅ ⎤⎦ =11.923 >11.8735 = I U⎡⎣ 0 (⋅)⎤⎦ .
Пример 6*. В условиях предыдущего примера принимается, что
⎧⎪⎛u1 ⎞ 2⎫⎪ P = ⎨⎜ ⎟∈R≤1⎬.⎪⎩⎝u2 ⎠⎭⎪
Тогда
1
ε( )l == − 4l +9l +50l1 +30l2 − ∫ 12 e−(1−τ) (1+ e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l d2 τ−