Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 20 из 49)

Пример 5*. Рассматривается следующая управляемая динамическая система

x1 = 2x1 +9x2 +u1, ⎧⎪⎛u1 ⎞22 2 ⎫⎪

, uP = ⎨⎜ R u1 +u2 ≤1⎬, t∈[0,1],

x2 = x1 + 2x2 +u2 ⎪⎩⎝u2 ⎠⎪⎭

⎧⎪⎛ m1 ⎞⎫⎪

M = ⎨⎜ ≤1, k = n = 2, x1 (0) = x2 ( )0 = 0.

⎪⎩⎝m2 ⎠⎪⎭

Фундаментальная матрица Коши для однородной системы дифференциальных уравнений здесь имеет вид

12 e−(t−τ) (1+e6(t−τ) ) 32 e−(t−τ) (− +1 e6(t−τ) )⎞

X t[ ,τ] = ⎜⎜⎜ ⎟⎟⎟ .

Вычислим опорную функцию χ(M,⋅)терминального множества M . Име-

ем

ml1 1 + m l2 2

.

Обозначим n1 = m1 −50, n2 = m2 −12. Тогда

n2 n2

(n1 +50)l1 +(n2 +12)l2 = nl1 1 + n l2 2 +50l1 +30l2 → max,

.

Отсюда выводим

2 2 l 2

χ(M,l) = 4l +9l +50l +30l l, = ∈R .

Выражение ε( )l здесь принимает вид

T

ε( )l = −max m l, 0 + X T t[ , 0 ]x, l0 + ∫minu P

t0

+ ⎜

l2 ⎠

X T[ ,τ τ τ]B( ) ( )u , l0

=

3 e−(1(−1τ−τ) )(− +1 e6 1( −τ) )⎟⎞⎛ ⎞⎜ ⎟0 , ⎛⎜l1 ⎞⎟+

2

12 e− (1+e6 1( −τ) ) ⎟⎠⎟⎝ ⎠0 ⎝l2 ⎠


u1 ⎞ ⎜

u ⎠ )

1


) ∫ ⎡⎡ 1 e−(1−τ) (1+ e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 ⎤⎦2 +

= −4l +9l +50l1 +30l2 − ⎢⎣ 2

0 ⎣

2

+⎣ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+e6 1( −τ) )l2 ⎥⎦ dτ=

,

где обозначено

2

Ε(τ, ,l l1 2 ) = ⎢⎣⎡⎣⎡ 12 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 ⎦⎤ +

2

+23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+e6 1( −τ) )l2 ⎥⎦ .

Функция Uˆ , доставляющая минимум в выражении (8), определяется формулой

1 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2

2

⎜−

ˆ ( , ) = ⎜⎜ Ε(τ, ,l l1 2 ) ⎟⎟. (12)

U t l

⎜ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l2 ⎟

⎜−

⎜⎝ Ε(τ, ,l l1 2 ) ⎟⎠

Задача математического программирования (10) формулируется следующим образом:

.

Ее решение в силу равенства l2 = ± 1−l12 сводится к проблеме максимизации функции одного переменного l1 ∈ −[ 1,1]. Максимум целевой функции и вектор, на котором этот максимум достигается, соответственно имеют вид

0

0 0 0 l1 ⎞ ⎛−0.316⎞

ε ε= ( )l =11.874 > 0, l = ⎜ 0 ⎟ = ⎜ .

l2 ⎠ ⎝−0.949⎠

Подставляя l0 в (12,) находим управление

1 e−(1−τ) (1+e6 1( −τ) )l10 + 16 e−(1−τ) (− +1 e6 1( −τl) )l20 ⎞

2

⎜−

⎜ Ε(τ,l l10, 20 ) ⎟

U 0 ( )t = ⎜ ⎟,

3 e−(1−τ) (− +1 e6 1( −τ) )l10 + 12 e−(1−τ) (1+e6 1( −τ) )l20 ⎟

2

⎜ −

⎜⎝ Ε(τ,l l10, 20 ) ⎟⎠

удовлетворяющее необходимым условиям оптимальности.

Подставим это управление в исходное дифференциальное уравнение и проинтегрируем полученное уравнение с заданными начальными условиями.

Ниже на рис. 8 приводятся графики изменения фазовых координат по времени для найденного закона движения объекта

Рис. 8

Вычислим координаты фазового вектора в конечный момент времени и финальное расстояние от него до целевого множества

0 x10 ( )1 ⎞ ⎛45.817⎞ 0 0

x ( )1 = ⎜x20 ( )1 = ⎜15.805, I U⎡⎣ ( )⋅ ⎤⎦ = ρ(x ( )1 ,M ) =11.874.

Непосредственно убеждаемся в справедливости равенства

ε ε0 = (l0 ) = I U0 (⋅)⎤.

Таким образом, стратегия U 0 является оптимальной стратегией, а отвечающая ей траектория движения объекта – оптимальной траекторией. Для сравнения вычислим финальное расстояние от фазового вектора до терминального множества в случае, когда в качестве допустимого программного управления взята вектор- функция

12 e−(1−τ) (1+e6 1( −τ) )l10 + 16 e−(1−τ) (− +1 e6 1( −τl) )l20 −0.5⎞ ⎜−

⎜ Ε1 (τ,l10,l20 ) ⎟ u t( ) = ⎜ ⎟,

⎜ 23 e−(1−τ) (− +1 e6 1( −τ) )l10 + 12 e−(1−τ) (1+e6 1( −τ) )l20 + 0.5 ⎟ ⎜ −

⎜⎝ Ε1 (τ,l10,l20 ) ⎟⎠

где

Ε1 (τ, ,l l1 2 ) = ⎡⎡ 12 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 −0.5⎤2 +

⎢⎣⎣ ⎦

2

+⎡⎣ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l2 + 0.5⎤⎦ ⎤⎦⎥ .

Пусть x( )⋅ = x(⋅,t0,x V0. ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛45.878⎞

x2 ( )1 ⎟⎠ = ⎜⎝ ⎟, I u⎡⎣ ( )⋅ ⎤ =⎦ 11.923.

⎝ 15.733⎠

Таким образом,

I u⎡⎣ ( )⋅ ⎤⎦ =11.923 >11.8735 = I U⎡⎣ 0 (⋅)⎤⎦ .

Пример 6*. В условиях предыдущего примера принимается, что

⎧⎪⎛u1 2⎫⎪ P = ⎨⎜ ⎟∈R≤1⎬.

⎪⎩⎝u2 ⎠⎭⎪

Тогда

1

ε( )l == −
4l +9l +50l1 +30l2
− ∫
12 e−(1−τ) (1+ e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l d2 τ−