x10 = 0.103, x20 = 0.197, x30 = 0.057, x40 = 0.121. (11)
Оптимальная программная стратегия задается формулой
U 0 ( )t = ⎛⎜−sign x⎡⎣ 13 (1,τ)l10 + x23 (1,τ)l20 ⎤⎦⎟⎞, t ∈[0,1]. (12)
⎜⎝−sign x⎡⎣ 14 (1,τ)l10 + x24 (1,τ)l20 ⎤⎦⎟⎠
Из графиков компонент вектора оптимального управления, представленных на
рис. 17,
U1 U2
0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1
Рис. 17.
видно, что оптимальное управление постоянно на всем промежутке времени [0,1]. Оптимальный закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с начальными условиями (11), в которую подставлено оптимальное программное управление (12). Ниже приводятся графики изменения первых двух координат фазового вектора от времени.
Рис. 18
Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до терминального множества задаются равенствами
0 ⎛ x10 ( )1 ⎞ ⎛1.053⎞ 0 0 0
{x ( )1 }2 = ⎜⎜ x20 ( )1 ⎠⎟⎟ = ⎜⎝0.975⎟⎠ , ρ(x (1),M ) = 3.973 =ε( )l =ε .
⎝
Последнее равенство означает оптимальность найденного программного управления.
Полученный результат лучше, чем в примере 8 (4.282 ) и лучше, чем в примере 11 (4.287 ). Это объясняется тем, что в первом случае точка x0 из примера 8 принадлежит множеству S0 данного примера, а во втором случае тем, что множество P из примера 11 вложено в множество P данного примера.
Упражнения для самостоятельной работы
1. Найти ошибку в рассуждениях.
Рассмотрим управляемый динамический объект
⎛u1 ⎞ ⎧⎪⎛ux1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜
⎝u2 ⎠ ⎪⎩⎝
⎛ x10 ⎞ ⎛ ⎞0
⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x = (x −0.25) +(x − 2) .
⎝ x20 ⎠ ⎝ ⎠0
Критерий качества Φ здесь имеет смысл расстояния от финального положения фазового вектора до точки M , положение которой задается вектором
⎛0.25⎞
rM = ⎜ ⎟. Тогда оптимальное управление (одно из возможных) имеет вид⎝ 2 ⎠
0 ⎛0.25⎞
u ( )t = ⎜ ⎟, t ∈[0,1].
⎝ 1 ⎠
Покажем, что управление u0 (⋅) не удовлетворяет условиям принципа максимума Л.С. Понтрягина. Действительно, выпишем функцию Л.С. Понтрягина
H t x u( , , ,ψ ψ ψ) = 1 1u + 2u2 .
Максимум этой функции достигается, когда
uˆ1 = sign(ψ1 ), uˆ2 = sign(ψ2 ).
Сопряженная система здесь записывается так:
ψ1 = 0,ψ2 = 0 ⇒ψ10 (t) = c1,ψ20 (t) = c2 .
Управления, подозрительные на оптимальность, удовлетворяют условию
uˆ1 = sign c( 1 ) = const u, ˆ2 = sign c( 2 ) = const.
После подстановки управлений u uˆ1, ˆ2 в основную систему дифференциальных уравнений получим
x1 = sign c( 1 ), x2 = sign c( 2 ).
Интегрируя основную систему, с учетом начальных условий находим
x10 ( )t = sign c t( )1 , x20 ( )t = sign c( 2 )t ⇒ x10 (1) = sign c( 1 ), x20 ( )1 = sign c( )2 .
Выпишем условия трансверсальности в конечный момент времени
− ⇒
⎛
⎜
⎝⎛⎜⎜ψψ1200 ( )( )11 ⎠⎞ ⎜⎜
⎟⎟ = −⎜
⎜
⎜⎜
⎝
x10 (1)−0.25 ⎞
⎟
(x10 ( )1 −0.1)2 +(x20 ( )1 −2)2 ⎟
⎟ ⇒ x20 ( )1 −2 ⎟
⎟ (x10 ( )1 −0.1)2 +(x20 ( )1 −2)2 ⎟⎟⎠⎧ sign c( 1 )−0.25
⎪c1 = − 2 2 ,
⎪⎪ (sign c( )1 −0.1) +(sign c( )2 −2)
⎨
⎪c2 = − sign c( )2 −2 .⎪ 2 2
⎪⎩ (sign c( )1 −0.1) +(sign c( )2 −2)Пусть c10,c20 - решение этой системы. Очевидно, что c c . Тогда оптимальное управление должно привести управляемую точку в вершины квадрата. Управление u0 (⋅) этому условию не удовлетворяет.
Рассмотреть два случая геометрических ограничений на вектор управляющих параметров
⎪⎜ ⎟
1) P = ⎨⎜u2 ⎟
⎪⎩⎜⎝u3 ⎟⎠
⎫ ⎧⎛u1 ⎞ 2 2 2 ⎪ ⎪⎜ ⎟ u1 +u2 +u3 ≤1⎬, 2) P = ⎨⎜u2 ⎟
⎪⎭ ⎪⎩⎜⎝u3 ⎟⎠
⎫
⎪
u ≤1, i =1,2,3⎬.⎪ ⎭
Убедиться, что результат управления во втором случае будет «лучше», чем в первом случае. Задачу оптимального управления следует решить двумя способами. Первый способ состоит в использовании необходимых условий оптимальности в форме принципа максимума Л.С. Понтрягина, второй способ – в форме прицеливания на опорный вектор к множеству области достижимости.
Проверить выполнение достаточных условий оптимальности.
3. Решить приведенные выше задачи оптимального управления в предположении, что начальное положение фазового вектора не фиксировано. Считать, что
3. ЗАДАЧА ЛИНЕЙНОГО ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ
3.1. Постановка задачи линейного предельного быстродействия и существование ее решения. Линейную задачу теории оптимального управления назовем задачей линейного быстродействия, если:
1) минимизируемый функционал имеет форму Лагранжа с подынтеграль-
ной функцией f 0 ≡1;
2) начальный момент времени фиксирован θ0 ={t0 };
3) конечный момент времени не фиксирован θ1 ∈{T
T > t0};4) левый и правый конец траектории закреплены S0 ={x0}, S1 ={0}, x0 ≠ 0 ,
5) область изменения управляющих параметров P ⊂ Rr выпукла.
Теорема 1 (Существование решения задачи линейного быстродействия.) Пусть для некоторого момента времени T ∗ > t0 выполнено включение
0∈G t( 0,x T0, ∗ ),
где G t x T( 0, 0, ),T > t0 - область достижимости управляемого объекта. Тогда задача линейного быстродействия имеет решение.
Доказательство. По предположению теоремы
Τ ={T > t0
0∈G t( 0,x T0, )} ≠ ∅ .Обозначим T 0 = inf T . Достаточно показать, что
T∈Τ
0∈G t( 0,x T0, 0 ). (1)
Рассмотрим последовательность
{Tk} →T 0, Tk ∈Τ, k =1,2,
Включение (1) следует из замкнутости области достижимости, непрерывной зависимости ее от T и включений
0∈G t x T( 0, 0, k ), k =1,2,
Теорема доказана.
Момент времени T 0 будем называть оптимальным временем перехода.
3.2. Необходимые условия оптимальности программной стратегии.
Пусть выполнены условия теоремы 1. Полагаем
ε[ ]T = maxl=1 ⎡⎢⎣q G t∈ min( 0 0,x T, ) q l, ⎥⎦⎤ = maxl =1 F l T( , ), T ≥ t0 , (1)