Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 7 из 49)

⎜ ⎟ ⎜ −4sin(t −τ) ⎟

⎝ ⎠

( )3 ⎜2e33t(tττ) ⎟ 3 ⎛⎜7cos(t −τ)+sin(t −τ)⎟⎞ 1 ⎛⎜ 3cos(t −τ)−sin(t −τ) ⎞⎟

3 ( )

x [t,τ] = ⋅⎜ e ⎟−⎟ ⋅⎜⎝cos(t −τ)−2sin(t −τ)⎟+ 2 ⋅⎜⎜−4cos(−t −sinτ)(+t −2τsin) (t −τ)⎟⎠⎟ =

10 ⎜ ⎟ 10 ⎜ −10cos(t −τ) ⎠⎟ ⎝

⎜ 0

⎝ ⎠

⎛ 53 e3(t−τ) − 53 cos(t −τ)− 54 sin(t −τ) ⎞

⎜ ⎟

= ⎜ 103 e3(t−τ) − 103 cos(t −τ)+ 101 sin(t −τ)⎟ . ⎜ ⎟ ⎜ cos(t −τ)+sin(t −τ) ⎟

⎝ ⎠

Получили совпадение с формулой (10). Непосредственно убеждаемся, что равенства (1)-(4) выполняются (см. приложение).

В случае A= const дадим другую интерпретацию для фундаментальной матрицы Коши.

Определение 4. Квадратная матрица etA , определенная степенным рядом

etA = + + + + + +E 1!A t A2!2 t2 A3!3 t3 " Akk! tk " , (11)

где E - единичная матрица размера n×n , называется экспоненциалом матрицы A.

Покажем, что ряд (11) сходится абсолютно для любого фиксированного t R1 . Действительно, с одной стороны,

Akk! tk Ak!k t k , k = 0,1,2,",

а с другой стороны, степенной ряд

1+ + + + + +1!A t A2!2 t2 A3!3 t3 " Ak!k tk "

сходится абсолютно при всех t R1 .

Из абсолютной сходимости ряда (11) следует, что его можно почленно дифференцировать. Вычисляем

d

tA d A A2 2 A3 3 Ak k A2 A3 2 Ak k

e = (E + + + + + + = + + + + + =1! t 2! t 3! t " k! t ") A 1! t 2! t " k! t "

dt dt

= + + + + +A(E 1!A t A2!2 t2 A3!3 t3 " (kAk−1 !1) tk−1 + =") AeAt . (12)

Из (12) вытекает справедливость матричного равенства

d tA At

e = Ae , dt

которое означает, что столбцы экспоненциала матрицы A являются решениями однородного дифференциального уравнения

x = Ax. (13)

В силу очевидного равенства eAtt0 = E эти столбцы образуют фундаменталь-

=

ную систему решений дифференциального уравнения (13). Таким образом,

X [t,τ]= e(tτ)A, t,τ R1 .

1.4. Допустимые реализации вектора управляющих параметров.

Пусть управление динамическим объектом осуществляется на промежутке времени [t T0, ]. Начальную точку траектории x0 называют левым концом траектории, а конечную xT – правым концом траектории. Начальный t0 и конечный

T моменты времени в общем случае не являются фиксированными. Предполагается, что t0 θ0 ⊂ R1, T

R t t . На левый и правый концы траектории обычно накладываются ограничение в форме включений

x0 S0 ( )t0 Rn, t0 ∈θ0, xT S T1( ) ⊂ Rn, T ∈θ1 .

В задачах теории оптимального управления принята следующая терминология: если множество S0 (множество S1 ) состоит из одной точки и не зависит от t0 ∈θ0 (T ∈θ1 ), то говорят, что левый (правый) конец траектории закреплен; если S0 (t0 ) = Rn , t0 ∈θ0 , (S1 (T) = Rn ,T ∈θ1 ), то левый (правый) конец траектории называют свободным.

Реализация вектора управляющих параметров не является произвольной функцией времени. Эта функция должна быть достаточно «гладкой» и в любой момент времени удовлетворять геометрическим ограничениям

u t( )∈ PRr, t ∈[t T0, ].

Оба приведенных требования обусловливаются техническими возможностями механизмов, осуществляющих управляющие воздействия на объект.

С другой стороны, слишком «бедное» множество возможных реализаций вектора управляющих воздействий может не обеспечить достижение поставленной цели управления. В частности, таковым является класс непрерывных на отрезке времени [t T0, ] функций. Покажем это на примере.

Пример 6. Рассмотрим поезд, движущийся от станции A к станции B в соответствии с уравнениями

x1 = x2, x2 =u ,

где x1 - расстояние от станции A до поезда; u - тяга поезда, которой можно управлять. На величину тяги наложено ограничение u ≤1. Требуется так выбрать управление, чтобы поезд преодолел путь между станциями за наименьшее время. При этом скорость в начальный и конечный моменты времени должна быть нулевой.

x1

Рис. 4

Нетрудно сообразить, что время перехода будет минимальным, когда поезд до половины пути разгоняется с максимальным ускорением u t( )=+1, а вторую половину максимально затормаживается, т.е. u t( )=−1. Таким образом, реализация оптимального управления в данном случае имеет вид

0 1, , , u t

1, , ,

Функция u0 (t), t ∈[t T0, ] терпит разрыв в точке

T .

Из опыта решения прикладных задач следует, что реализации вектора управляющих воздействий принадлежат классу C0 [t T0, ] – кусочно-непрерывных функций, то есть таких функций u:[t0 ,T]→ R r , которые непрерывны в каждой точке t∈[t0 ,T], за исключением, быть может, конечного числа точек τ1, ,τm ∈[t0 ,T], в которых функция u()⋅ терпит разрывы первого рода. В этих точках существуют конечные пределы

t→limτi −0 u(t) = ui − 0), t→limτi +0 u(t) = ui + 0),

но ui − 0)≠ ui + 0),i =1, ,m. В теории оптимального управления принимается, что в точках разрыва реализации вектора управляющих воздействий непрерывны справа. Таким образом,

t→limτi +0 u(t) = ui ),i =1, ,m .

Определение 5. Реализация u()⋅ вектора управляющих воздействий называется допустимой, если u()⋅ ∈C t T0 [ 0, ], функция u()⋅ непрерывна справа в точках разрыва и выполнено условие u t( )∈ PRr, t ∈[t T0, ].

Определение 6. Движением линейного динамического объекта, отвечающим допустимой реализации вектора управляющих воздействий u()⋅ и выходящим из начального положения x0 S0 (t0), называется решение следующей задачи Коши для векторного дифференциального уравнения

x = A t x( ) +B t u t( ) ( )+C t( ), x t( 0)= x0 . (1)

Это движение будем обозначать символом x(⋅, ,t0 x u0, ()).

Кусочно-непрерывная реализация вектора управляющих воздействий не гарантирует непрерывность по переменной t правой части дифференциального уравнения (1), поэтому условия классической теоремы существования и единственности решения задачи Коши для дифференциального уравнения здесь не выполняются. В связи с этим предлагается следующая процедура построения движения динамического объекта, отвечающего реализации вектора управляющих воздействий u( )⋅ ∈C0 [t T0, ] и выходящего из начального положения x0 S0 ( )t0 . Пусть τ1, ,τm ∈[t0 ,T] - точки разрыва функции u(⋅). Движение объекта на полуинтервале [t0 1 ) отождествим с решением задачи Коши

x = A t x( ) +B t u t( ) ( )+C t( ), x t( )0 = x0, t ∈[t0,τ1).

В силу непрерывности управления u(⋅) на полуинтервале [t0 1 ) сформулированная задача Коши имеет решение и притом единственное. Доопределим фазовый вектор в момент времени τ1 по непрерывности, положив

x1 = x1 )= lim x(t) .