⎜ ⎟ ⎜ −4sin(t −τ) ⎟
⎝ ⎠
( )3 ⎛⎜2e33t(−tτ−τ) ⎞⎟ 3 ⎛⎜7cos(t −τ)+sin(t −τ)⎟⎞ 1 ⎛⎜ 3cos(t −τ)−sin(t −τ) ⎞⎟
3 ( )
x [t,τ] = ⋅⎜ e ⎟−⎟ ⋅⎜⎝cos(t −τ)−2sin(t −τ)⎟+ 2 ⋅⎜⎜−4cos(−t −sinτ)(+t −2τsin) (t −τ)⎟⎠⎟ =10 ⎜ ⎟ 10 ⎜ −10cos(t −τ) ⎠⎟ ⎝
⎝ ⎠
⎛ 53 e3(t−τ) − 53 cos(t −τ)− 54 sin(t −τ) ⎞
⎜ ⎟
= ⎜ 103 e3(t−τ) − 103 cos(t −τ)+ 101 sin(t −τ)⎟ . ⎜ ⎟ ⎜ cos(t −τ)+sin(t −τ) ⎟
⎝ ⎠
Получили совпадение с формулой (10). Непосредственно убеждаемся, что равенства (1)-(4) выполняются (см. приложение).
В случае A= const дадим другую интерпретацию для фундаментальной матрицы Коши.
Определение 4. Квадратная матрица etA , определенная степенным рядом
etA = + + + + + +E 1!A t A2!2 t2 A3!3 t3 " Akk! tk " , (11)
где E - единичная матрица размера n×n , называется экспоненциалом матрицы A.
Покажем, что ряд (11) сходится абсолютно для любого фиксированного t ∈ R1 . Действительно, с одной стороны,
Akk! tk ≤ Ak!k t k , k = 0,1,2,",а с другой стороны, степенной ряд
1+ + + + + +1!A t A2!2 t2 A3!3 t3 " Ak!k tk "сходится абсолютно при всех t ∈ R1 .
Из абсолютной сходимости ряда (11) следует, что его можно почленно дифференцировать. Вычисляем
d
tA d A A2 2 A3 3 Ak k A2 A3 2 Ak ke = (E + + + + + + = + + + + + =1! t 2! t 3! t " k! t ") A 1! t 2! t " k! t "
dt dt
= + + + + +A(E 1!A t A2!2 t2 A3!3 t3 " (kA−k−1 !1) tk−1 + =") AeAt . (12)Из (12) вытекает справедливость матричного равенства
d tA At
e = Ae , dtкоторое означает, что столбцы экспоненциала матрицы A являются решениями однородного дифференциального уравнения
x = Ax. (13)
В силу очевидного равенства eAtt0 = E эти столбцы образуют фундаменталь-=
ную систему решений дифференциального уравнения (13). Таким образом,
X [t,τ]= e(t−τ)A, t,τ ∈ R1 .
1.4. Допустимые реализации вектора управляющих параметров.
Пусть управление динамическим объектом осуществляется на промежутке времени [t T0, ]. Начальную точку траектории x0 называют левым концом траектории, а конечную xT – правым концом траектории. Начальный t0 и конечный
T моменты времени в общем случае не являются фиксированными. Предполагается, что t0 ∈θ0 ⊂ R1, T
R t t . На левый и правый концы траектории обычно накладываются ограничение в форме включенийx0 ∈S0 ( )t0 ⊂ Rn, t0 ∈θ0, xT ∈S T1( ) ⊂ Rn, T ∈θ1 .
В задачах теории оптимального управления принята следующая терминология: если множество S0 (множество S1 ) состоит из одной точки и не зависит от t0 ∈θ0 (T ∈θ1 ), то говорят, что левый (правый) конец траектории закреплен; если S0 (t0 ) = Rn , t0 ∈θ0 , (S1 (T) = Rn ,T ∈θ1 ), то левый (правый) конец траектории называют свободным.
Реализация вектора управляющих параметров не является произвольной функцией времени. Эта функция должна быть достаточно «гладкой» и в любой момент времени удовлетворять геометрическим ограничениям
u t( )∈ P⊂ Rr, t ∈[t T0, ].
Оба приведенных требования обусловливаются техническими возможностями механизмов, осуществляющих управляющие воздействия на объект.
С другой стороны, слишком «бедное» множество возможных реализаций вектора управляющих воздействий может не обеспечить достижение поставленной цели управления. В частности, таковым является класс непрерывных на отрезке времени [t T0, ] функций. Покажем это на примере.
Пример 6. Рассмотрим поезд, движущийся от станции A к станции B в соответствии с уравнениями
x1 = x2, x2 =u ,
где x1 - расстояние от станции A до поезда; u - тяга поезда, которой можно управлять. На величину тяги наложено ограничение u ≤1. Требуется так выбрать управление, чтобы поезд преодолел путь между станциями за наименьшее время. При этом скорость в начальный и конечный моменты времени должна быть нулевой. x1Рис. 4
Нетрудно сообразить, что время перехода будет минимальным, когда поезд до половины пути разгоняется с максимальным ускорением u t( )=+1, а вторую половину максимально затормаживается, т.е. u t( )=−1. Таким образом, реализация оптимального управления в данном случае имеет вид
0 1, , , u t1, , ,
Функция u0 (t), t ∈[t T0, ] терпит разрыв в точке
T .Из опыта решения прикладных задач следует, что реализации вектора управляющих воздействий принадлежат классу C0 [t T0, ] – кусочно-непрерывных функций, то есть таких функций u:[t0 ,T]→ R r , которые непрерывны в каждой точке t∈[t0 ,T], за исключением, быть может, конечного числа точек τ1, ,τm ∈[t0 ,T], в которых функция u()⋅ терпит разрывы первого рода. В этих точках существуют конечные пределы
t→limτi −0 u(t) = u(τi − 0), t→limτi +0 u(t) = u(τi + 0),
но u(τi − 0)≠ u(τi + 0),i =1, ,m. В теории оптимального управления принимается, что в точках разрыва реализации вектора управляющих воздействий непрерывны справа. Таким образом,
t→limτi +0 u(t) = u(τi ),i =1, ,m .
Определение 5. Реализация u()⋅ вектора управляющих воздействий называется допустимой, если u()⋅ ∈C t T0 [ 0, ], функция u()⋅ непрерывна справа в точках разрыва и выполнено условие u t( )∈ P⊂ Rr, t ∈[t T0, ].
Определение 6. Движением линейного динамического объекта, отвечающим допустимой реализации вектора управляющих воздействий u()⋅ и выходящим из начального положения x0 ∈ S0 (t0), называется решение следующей задачи Коши для векторного дифференциального уравнения
x = A t x( ) +B t u t( ) ( )+C t( ), x t( 0)= x0 . (1)
Это движение будем обозначать символом x(⋅, ,t0 x u0, ()⋅ ).
Кусочно-непрерывная реализация вектора управляющих воздействий не гарантирует непрерывность по переменной t правой части дифференциального уравнения (1), поэтому условия классической теоремы существования и единственности решения задачи Коши для дифференциального уравнения здесь не выполняются. В связи с этим предлагается следующая процедура построения движения динамического объекта, отвечающего реализации вектора управляющих воздействий u( )⋅ ∈C0 [t T0, ] и выходящего из начального положения x0 ∈ S0 ( )t0 . Пусть τ1, ,τm ∈[t0 ,T] - точки разрыва функции u(⋅). Движение объекта на полуинтервале [t0 ,τ1 ) отождествим с решением задачи Коши
x = A t x( ) +B t u t( ) ( )+C t( ), x t( )0 = x0, t ∈[t0,τ1).
В силу непрерывности управления u(⋅) на полуинтервале [t0 ,τ1 ) сформулированная задача Коши имеет решение и притом единственное. Доопределим фазовый вектор в момент времени τ1 по непрерывности, положив
x1 = x(τ1 )= lim x(t) .