Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 27 из 49)

x10 = 0.103, x20 = 0.197, x30 = 0.057, x40 = 0.121. (11)

Оптимальная программная стратегия задается формулой

U 0 ( )t = ⎛⎜−sign x⎡⎣ 13 (1,τ)l10 + x23 (1,τ)l20 ⎤⎦⎟⎞, t ∈[0,1]. (12)

⎜⎝−sign x14 (1,τ)l10 + x24 (1,τ)l20

Из графиков компонент вектора оптимального управления, представленных на

рис. 17,

U1 U2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Рис. 17.

видно, что оптимальное управление постоянно на всем промежутке времени [0,1]. Оптимальный закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с начальными условиями (11), в которую подставлено оптимальное программное управление (12). Ниже приводятся графики изменения первых двух координат фазового вектора от времени.

Рис. 18

Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до терминального множества задаются равенствами

0 x10 ( )1 ⎞ ⎛1.053⎞ 0 0 0

{x ( )1 }2 = ⎜⎜ x20 ( )1 ⎟⎟ = ⎜0.975, ρ(x (1),M ) = 3.973 =ε( )l .

Последнее равенство означает оптимальность найденного программного управления.

Полученный результат лучше, чем в примере 8 (4.282 ) и лучше, чем в примере 11 (4.287 ). Это объясняется тем, что в первом случае точка x0 из примера 8 принадлежит множеству S0 данного примера, а во втором случае тем, что множество P из примера 11 вложено в множество P данного примера.

Упражнения для самостоятельной работы

1. Найти ошибку в рассуждениях.

Рассмотрим управляемый динамический объект

u1 ⎞ ⎧⎪⎛u

x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜

u2 ⎠ ⎪⎩⎝

x10 ⎞ ⎛ ⎞0

⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x = (x −0.25) +(x − 2) .

x20 ⎠ ⎝ ⎠0

Критерий качества Φ здесь имеет смысл расстояния от финального положения фазового вектора до точки M , положение которой задается вектором

⎛0.25⎞

rM = ⎜ ⎟. Тогда оптимальное управление (одно из возможных) имеет вид

⎝ 2 ⎠

0 ⎛0.25⎞

u ( )t = ⎜ , t ∈[0,1].

⎝ 1 ⎠

Покажем, что управление u0 (⋅) не удовлетворяет условиям принципа максимума Л.С. Понтрягина. Действительно, выпишем функцию Л.С. Понтрягина

H t x u( , , ,ψ ψ ψ) = 1 1u + 2u2 .

Максимум этой функции достигается, когда

uˆ1 = sign1 ), uˆ2 = sign2 ).

Сопряженная система здесь записывается так:

ψ1 = 0,ψ2 = 0 ⇒ψ10 (t) = c120 (t) = c2 .

Управления, подозрительные на оптимальность, удовлетворяют условию

uˆ1 = sign c( 1 ) = const u, ˆ2 = sign c( 2 ) = const.

После подстановки управлений u uˆ1, ˆ2 в основную систему дифференциальных уравнений получим

x1 = sign c( 1 ), x2 = sign c( 2 ).

Интегрируя основную систему, с учетом начальных условий находим

x10 ( )t = sign c t( )1 , x20 ( )t = sign c( 2 )t x10 (1) = sign c( 1 ), x20 ( )1 = sign c( )2 .

Выпишем условия трансверсальности в конечный момент времени

− ⇒

⎝⎛⎜⎜ψψ1200 ( )( )11 ⎠⎞ ⎜⎜

⎟⎟ = −⎜

⎜⎜

x10 (1)−0.25 ⎞

(x10 ( )1 −0.1)2 +(x20 ( )1 −2)2

⎟ ⇒ x20 ( )1 −2 ⎟

⎟ (x10 ( )1 −0.1)2 +(x20 ( )1 −2)2 ⎟⎟

sign c( 1 )−0.25

c1 = − 2 2 ,


(sign c( )1 0.1) +(sign c( )2 2)

c2 = − sign c( )2 −2 .

⎪ 2 2

⎪⎩ (sign c( )1 −0.1) +(sign c( )2 −2)

Пусть c10,c20 - решение этой системы. Очевидно, что c c . Тогда оптимальное управление должно привести управляемую точку в вершины квадрата. Управление u0 (⋅) этому условию не удовлетворяет.


2. Для линейных управляемых динамических систем, описанных в упражнениях раздела 1 (дифференциальные уравнения движения, начальные условия, отрезок времени управления), решить задачу оптимального управления со следующими функционалами:

Рассмотреть два случая геометрических ограничений на вектор управляющих параметров


⎧⎛u1

⎪⎜ ⎟

1) P = ⎨⎜u2 ⎟

⎪⎩⎜⎝u3 ⎟⎠

⎫ ⎧⎛u1 2 2 2 ⎪ ⎪⎜ ⎟ u1 +u2 +u3 ≤1⎬, 2) P = ⎨u2

⎪⎭ ⎪⎩⎜⎝u3 ⎟⎠

u ≤1, i =1,2,3⎬.

⎪ ⎭


Убедиться, что результат управления во втором случае будет «лучше», чем в первом случае. Задачу оптимального управления следует решить двумя способами. Первый способ состоит в использовании необходимых условий оптимальности в форме принципа максимума Л.С. Понтрягина, второй способ – в форме прицеливания на опорный вектор к множеству области достижимости.

Проверить выполнение достаточных условий оптимальности.

3. Решить приведенные выше задачи оптимального управления в предположении, что начальное положение фазового вектора не фиксировано. Считать, что


3. ЗАДАЧА ЛИНЕЙНОГО ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ

3.1. Постановка задачи линейного предельного быстродействия и существование ее решения. Линейную задачу теории оптимального управления назовем задачей линейного быстродействия, если:

1) минимизируемый функционал имеет форму Лагранжа с подынтеграль-

ной функцией f 0 ≡1;

2) начальный момент времени фиксирован θ0 ={t0 };

3) конечный момент времени не фиксирован θ1 ∈{T

T > t0};

4) левый и правый конец траектории закреплены S0 ={x0}, S1 ={0}, x0 ≠ 0 ,

5) область изменения управляющих параметров P Rr выпукла.

Теорема 1 (Существование решения задачи линейного быстродействия.) Пусть для некоторого момента времени T > t0 выполнено включение

0∈G t( 0,x T0, ),

где G t x T( 0, 0, ),T > t0 - область достижимости управляемого объекта. Тогда задача линейного быстродействия имеет решение.

Доказательство. По предположению теоремы

Τ ={T > t0

0∈G t( 0,x T0, )} ≠ ∅ .

Обозначим T 0 = inf T . Достаточно показать, что

T∈Τ

0∈G t( 0,x T0, 0 ). (1)

Рассмотрим последовательность

{Tk} →T 0, Tk ∈Τ, k =1,2,

Включение (1) следует из замкнутости области достижимости, непрерывной зависимости ее от T и включений

0∈G t x T( 0, 0, k ), k =1,2,

Теорема доказана.

Момент времени T 0 будем называть оптимальным временем перехода.

3.2. Необходимые условия оптимальности программной стратегии.

Пусть выполнены условия теоремы 1. Полагаем

ε[ ]T = maxl=1 q G t∈ min( 0 0,x T, ) q l, ⎥⎦ = maxl =1 F l T( , ), T t0 , (1)