Распишем подробнее левую часть условия (6). Имеем
⎛b11 ( )t BTр ( )t ψ= ⎜⎜ ⎜b1r ( )t ⎝ | ⎛ n ⎞ b t ψ bn1 ( )t ⎞⎛⎜ψ1 ⎞⎟ ⎜⎜∑k=1 k1 ( ) k ⎟⎟ ⎟ ⎟⎜ ⎟ = ⎜ ⎟ . bnr ( )t ⎟⎠⎜⎝ψn ⎟⎠ ⎜⎜∑n bkr ( )t ψk ⎟⎟⎟ ⎜ ⎝ k=1 ⎠ |
Тогда задача математического программирования принимает вид
n n ⎛u1 ⎞ ⎛ ⎞ ⎛ ⎞ ⎜ ⎟
u1 ⎜∑bk1 ( )t ψk ⎟+ +ur ⎜∑bkr ( )t ψk ⎟ → max, ⎜ ⎟∈P . (7)
⎝ k=1 ⎠ ⎝ k=1 ⎠ ⎜⎝ur ⎟⎠
По теореме Вейерштрасса максимум в условии (7) существует для любой пары (t,ψ)∈[t T0, ]×Rn . Следовательно, можно определить вектор-функцию
Uˆ :[t T0, ]×Rn → P , (8)
которая каждой паре (t,ψ)∈[t T0, ]×Rn ставит в соответствие вектор U tˆ ( ,ψ)∈P , доставляющий максимум в условии (7).
Пусть функция Uˆ уже построена. Рассмотрим систему из 2n обыкновенных дифференциальных уравнений
⎧⎪⎨x = A t x( ) + B t U t( ) ˆTр( ,ψ)+C t( ), (10)
⎪⎩ ψ= −A ψ.
относительно 2n неизвестных x,ψ с 2n граничными условиями
x( ) ( ) . (11) xЗаметим, что в общем случае эта система нелинейная. Более того, функция Uˆ может оказаться разрывной по переменной ψ, и тогда для системы дифференциальных уравнений (10) не будут выполняться условия существования решения. В случае, когда все же для задачи (10), (11) получено решение x0 (⋅),ψ0 (⋅), программная стратегия U0 ( )⋅ =Uˆ (⋅,ψ0(⋅)) будет удовлетворять условиям теоремы 1, т.е. являться стратегией подозрительной на оптимальную стратегию.
2.2. Поведение функции Л.С. Понтрягина вдоль оптимальной пары
В предыдущем пункте (теорема 1) было доказано, что функция Понтрягина на оптимальном управлении принимает максимальное значение. Установим ниже некоторые общие свойства функции максимума (минимума).
Пусть F : X ×Y → R1, X ⊂ Rn ,Y ⊂ Rm – некоторая функция, непрерывная по совокупности своих переменных в каждой точке области определения. При этом множество Y компактное, а множество X – открытое. Положим
F 0(x)= max F(x, y), x∈ X , (1)
y∈Y
Y 0( )x = {y0(x)F(x, y0(x))= F 0(x)}, x∈ X .Лемма 1. Функция F 0 : X → R1 , определенная равенством (1), является непрерывной в каждой точке x∈X .
Доказательство. Пусть x∈ X . Для всякого ∆x∈Rn , x + ∆x∈ X положим
∆F 0 (x) = F 0 (x + ∆x)− F 0 (x)= F(x + ∆x, y 0 (x + ∆x))− F(x, y 0 ( )x ).
Справедливо двойное неравенство
F(x + ∆x, y 0 (x))− F(x, y 0 ( )x )≤ ∆F 0 (x) ≤ F(x + ∆x, y 0 (x + ∆x))− F(x, y 0 (x + ∆x)), (2) из которого следует, что ∆F 0 (x) → 0 при ∆x → 0. Лемма доказана.
Определение 1. Будем говорить, что многозначное отображение χ: X → 2Y , где через 2Y обозначено множество всех подмножеств множества Y , называется полунепрерывным сверху по включению в точке x∗ ∈ X , если для всякой последовательности {x( )s } → x∗ и {y( )s } → y∗, y( )s ∈χ(x( )s ), s =1,2, имеет место включение y∗ ∈χ(x∗).
Заметим, что если отображение χ однозначно, т.е. множество χ(x) состоит ровно из одного элемента при всех x∈ X , то из полунепрерывности сверху по включению этого отображения следует его непрерывность в обычном смысле.
Лемма 2. Многозначное отображение Y 0 : X → 2Y полунепрерывно сверху по включению в каждой точке x∈X .
Доказательство. От противного приходим к существованию точки x∗ ∈ X и таких последовательностей
{ }xs → x∗, xs
Y, ys0 ∈Y 0 (xs ), s =1,2 ,что y∗ ∉Y 0 ( )x∗ . Тогда найдется число ε> 0, для которого
F 0 (x∗)− F(x∗, y∗)=ε. (3)
Из непрерывности функций F,F 0 и сходимости последовательностей {xs },{ys } к точкам x∗ , y∗ , соответственно, для достаточно больших номеров s будут справедливы неравенства
F 0 ( )x∗ − F 0 ( )xs F(x∗, y∗)− F(xs , ys0 ) < ε. (4)3
Учитывая, что F
, , из соотношений (3),(4) выводимε= F 0 ( )x∗ − F(x∗, y∗)=
F 0 (x∗)− F(x∗, y∗) ≤ ≤ F 0 ( )x∗ − F 0 (xs ) + F(xs , ys0 )− F(x∗, y∗) < ε + ε = 2ε<ε.3 3 3
Получили противоречие, которое и доказывает лемму.
Дополнительно предположим, что функция F непрерывно дифференцируема по переменной x в области X , а множество Y 0 (x) состоит ровно из одного элемента y 0 (x) при всех x∈ X . Тогда, как отмечалось выше, функция y 0 : X → Rm будет непрерывной в каждой точке x∈ X .
Теорема 2. В принятых предположениях функция F 0 : X → R1 непрерывно дифференцируема в каждой точке области определения и при этом имеет место равенство
∂ 0 ∂∗ 0
F ( )x = ∗ F(x, y ( )x ), x∈ X , (5) ∂x ∂ xгде индекс «∗» в обозначении производной по векторному аргументу x в правой части (5) означает, что эта производная вычисляется без учета зависимости y 0 от x∈ X .
Доказательство. По формуле конечных приращений [7] из двойного неравенства (2) находим
F(x, y 0 (x + ∆x)), ∆x + o ∆x ≤ ∆F 0 ( )x ≤ F(x, y 0 ( )x ), ∆x + o ∆x . (6)Из соотношений (6) с учетом непрерывности функции y 0 следует, что
∆F 0 ( )x = F(x, y 0 ( )x ), ∆x + o ∆x .Последнее условие означает дифференцируемость функции F 0 в точке x∈X и справедливость равенства (5). Из непрерывности правой части равенства (5) следует непрерывность и его левой части. Теорема доказана.
Докажем одно важное свойство функции Л.С. Понтрягина.
Теорема 3. Пусть A= const B, = const C, = const и тройка U 0 ( )⋅ ,x0 (⋅),ψ0 (⋅) удовлетворяет условиям теоремы 1. Тогда функция Л.С. Понтрягина