T
+ x0, XТр[T t l, 0 ] 0∗ + ∫ B( )τ U 0 ( )τ , XТр[T,τ τ]ld +t0
C( )τ , XТр[t,τ τ]l0∗d > −max m l, 0 + x0, XТр[T t l, 0 ] 0∗+m M∈
0
T T
+∫minu P∈ B( )τ u X, Тр[T,τ τ]l0∗ d + ∫ C( )τ , XТр[t,τ τ ε]l0∗ d = 0 .t0 t0
Получили противоречие. Теорема доказана.
Очевидно (см. рис. 7), что0 {x0 ( )T }k −m0 l =.
{x0 ( )T }k −m0Представим функцию Φ в виде
Φ( )x = minm M∈ { }x k −m,{ }x k −m == { }x k −m0 ( ) { }x , x k −m0 ( )x ,
Рис. 7 x∈Rn .
Из теоремы 3 следует, что
⎧∂Φ(x)⎫
⎨ ⎬ =⎩ ∂x ⎭k
⎧ ∂ ⎫ {x} −m0 (x) {x} −m0 ( )x
При x = x0 ( )T отсюда выводим
⎧⎪∂Φ(x0 ( )T )⎫⎪ {x0 (T )}k −m0 (x0 (T )) 0 ∂Φ(x0 ( )T ) 0∗
⎨ ⎬ = 0 0 0 = l ⇒ = l . ⎪⎩ ∂x ⎪⎭k {x ( )T }k −m (x ( )T ) ∂x Тогда условие (5) эквивалентно следующему:0 ТрТр ∂Φ(x0 ( )T )
B( )t U ( )t , −X [T t, ]= maxB t u( ) , −X [T t, ], t∈[t T0, ].u P∈∂x
В силу равенства
0 Тр ∂Φ(x0 (T ))
ψ ( )t = −X [T t, ] , t∈[t T0, ]∂x
необходимые условия оптимальности программного управления, доказанные в теореме 6, совпадают с аналогичными условиями принципа максимума Л.С. Понтрягина (теорема 1). Из теоремы 5 также следует, что если величина Φ(x0 ( )T ), вычисленная в результате интегрирования исходной системы дифференциальных уравнений после подстановки в нее программного управления, определенного из условия (4), совпадает с величиной ε0 , вычисленной по формуле (5), то это программное управление является оптимальным.
Пример 4. Рассмотрим линейный управляемый динамический объект из примера 1. Терминальный критерий качества Φ( )x = x12 +(x2 −2)2можно трактовать как расстояние в конечный момент времени от фазового вектора⎛ ⎞0 до точки m = ⎜ ⎟. Для данного примера выполнены равенства
⎝ ⎠2
⎛1 k = 2, X t[ ,τ] = ⎜ ⎝0 Последовательно вычисляем | 0⎞ ⎟, 1⎠ | ⎛1 B t( ) = ⎜ ⎝0 T | 0⎞ 0∗ 0 ⎟ , l = l . 1⎠ |
t0
⎤ ⎡ 1 ⎤
dτ⎥ = maxl=1 ⎢−2l2 − ∫( l1 + l2 )dτ⎥ =⎦⎥⎣ 0 ⎦
⎛l10 ⎞ ⎛ 0 ⎞
=1 ⎤ =1, ⎜ 0 ⎟ = ⎜ ⎟ . l ⎝l2 ⎠ ⎝−1⎠Необходимые условия оптимальности программного управления здесь принимают вид
u
t sign l u t sign l t . (7)В силу l10 = 0 условия(7) определяют программную стратегию неоднозначно. В частности, им удовлетворяет стратегия
U
t u d t .⎝ 1 ⎠ 0
При этом
I U⎣⎡ 0 (⋅)⎦⎤ =1=ε0 .
Следовательно, стратегия U 0 (⋅) является оптимальной.
Приведем последовательность действий по решению задачи управления динамической системой на основе теоремы 5.
В начале строится фундаментальная матрица Коши для однородной системы дифференциальных уравнений и вычисляется опорная функция χ(M, )⋅ целевого множества M по формуле
χ(M l, ) = maxm M∈ m l, , l ∈ S(0,1).Далее для произвольного l ∈S(0,1) решается задача математического программирования
⎛ l ⎞⎜ ⎟
Tр Тр 0
B ( )t X [T t, ]⎜ ⎟, u→ min, u∈P. (8)
⎜ ⎟
⎜⎜⎝ 0 ⎟⎟⎠
По теореме Вейерштрасса минимум в левой части равенства (8) существует для любой пары (t l, )∈[t T0, ]×S(0,1). Таким образом, определена векторфункция
Uˆ :[t T0, ]×S (0,1) → P, (9)
которая каждой паре (t l, )∈[t T0, ]×S(0,1) ставит в соответствие вектор U t lˆ ( , )∈P , доставляющий минимум в условии (8). Явная запись этой функции возможна для частных случаев управляемой системы, рассмотренных в предыдущем пункте. Пусть функция Uˆ уже построена. Тогда приходим к следующей задаче математического программирования:
⎛ l ⎞⎛ l ⎞⎜ ⎟⎜ ⎟
Тр 0Tр Тр 0 ε( )l = −χ(M l, )+[T t, 0 ]⎜ ⎟ U (τ,l), B ( )t X [T,τ]⎜ ⎟dτ+
⎜ ⎟⎜ ⎟
⎜⎜⎝ 0 ⎟⎟⎠⎜⎜⎝ 0 ⎟⎟⎠
C( )τ , XТр[dτ→ max , l=1. (10)Эта задача всегда имеет решение, а в случае когда ε ε0 = ( )l0 > 0 , ее решение единственное. Заметим, что приведенная задача математического программирования осложнена наличием определенных интегралов в выражении для целевой функции. Эти интегралы обычно не берутся
аналитически даже, если функция Uˆ определена явно.
Пусть ε0 > 0 и l0 ∈S(0,1) - максимизирующий вектор. Тогда программное управление, удовлетворяющее необходимому условию оптимальности, определяется по формуле
U 0 (⋅) =Uˆ (⋅,l0 ). (11)
После подстановки этого управления в исходные дифференциальные уравнения движения объекта, последние могут быть проинтегрированы с заданными начальными условиями. Далее проверяется справедливость равенства
ε0 = I U⎡⎣ 0 (⋅)⎤⎦ .
В случае его выполнения программная стратегия, определенная равенством (11), является оптимальной.