3) множество допустимых наборов G ={(t T x U0, , 0, ( )⋅ , x( )⋅ )} содержит хотя бы один элемент;
4) множество допустимых программных стратегий принадлежит пространству функций, интегрируемых по Лебегу на интервале управления.
Тогда существует допустимый набор
t T x U x G , на которомфункционал I достигает минимума.
Доказательству теоремы предпошлем лемму.
Лемма 2. Пусть R:[t0,t]→ K ⊂ Rn – интегрируемая по Лебегу функция и множество K - выпуклый компакт. Тогда
1 t
∫ R( )τ dτ∈K . (1)
t − t0 t0
Доказательство. Известно [16], что для всякой интегрируемой по Лебегу функции R , определенной на интервале [t0 ,t], найдется последовательность ступенчатых функций { }Rs , определенных и равномерно сходящихся на этом интервале к функции R , причем справедливо равенство
t t
( ) R( )τ dτ. (2)t0 t0
Покажем, что включение (1) справедливо для всякой ступенчатой функции
R:[t0 ,T]→ K . Напомним, что функция называется ступенчатой, если она принимает конечное число значений R(1), ,R(k) ∈K . Обозначим
Tj = {τ∈[t0,t]
R(τ) = R( j)}, j =1, ,k .Тогда
1 t ∫ R( )τ dτ= . (3)t − t0 t0 t − t0 j=1
Здесь µ(T j ) – мера множества T j , j =1, ,k . Заметим, что
. tВыражение (3) представляет собой выпуклую комбинацию векторов R( j) ∈K , j =1, ,k . Отсюда следует справедливость включения (1) для случая, когда функция R ступенчатая. Доказательство общего случая использует предельный переход в (2) и условие компактности множества K .
Доказательство теоремы. B силу компактности множества Ξ функционал I ограничен на множестве допустимых наборов G . Из условия G ≠∅ следует существование для функционала I минимизирующей последовательности {(t0s ,T s ,x U0s , s ( )⋅ ,xs ( )⋅ )}, (t0s ,T s ,x U0s , s ( )⋅ ,xs (⋅))∈G , s =1,2, , т.е. такой последовательности, что
lims→∞ I t T⎡⎣ 0s , s ,x U0s , s ( )⋅ ,xs ( )⋅ ⎦⎤= (t T x U0, , 0inf, ( )⋅ ,x( )⋅ ∈) G I t T x U⎣⎡ 0, , 0, ( )⋅ ,x(⋅)⎦⎤ = I∗, I∗ < ∞ .В силу 2) из последовательности {(t T0s , s , x x0s , s (T s ))}, s =1,2, можно извлечь сходящуюся. Не теряя общности, считаем, что
{(t T0s , s , x x0s , s (T s ))} → (t T00, 0, x00,xT0 )∈Ξ .
Рассмотрим последовательность движений
{x( )s ( )⋅ }, x( )s ( )⋅ = x(⋅,t0s , x U0s , s ( )⋅ ), s =1,2,
Для всех номеров s =1,2, справедливо равенство
t t
x( )s ( )t = X t t⎡⎢⎣ , 0s ⎦⎤⎥ x0s +∫t X t[ ,τ] ( )B τ U s ( )τ τd +∫t X t[ ,τ] ( )C τ τd , t ∈⎡⎣t0s ,T s ⎦⎤ . (4)
0 0
Полагаем
⎧⎪ x0s , t ∈⎡⎣t0∗,t0s ) , x( )s ∗( )t = ⎨⎪ x( )s ( )t , t ∈⎡⎣t0s ,T s ⎤⎦ , (5)
⎪ ( )s s s ∗
⎪⎩x (T ), t∈(T ,T ⎤⎦ .
Из компактности множеств Ξ, P и формул (4) (5) следует, что функции, образующие последовательность {x( )s ∗ ( )⋅ }, равномерно ограничены и равностепенно непрерывны на отрезке ⎡⎣t0∗,T ∗ ⎤⎦ . По теореме Арцела (при необходимости следует перейти к подпоследовательности) эта последовательность равномерно сходится на отрезке ⎡⎣t0∗,T ∗ ⎤⎦ к некоторой абсолютно непрерывной функции x0∗ ( )⋅ . Очевидно, что
x
.Обозначим через x0 ( )⋅ сужение функции x0∗ (⋅) на отрезке ⎣⎡t00,T 0 ⎦⎤ и докажем существование допустимой программной стратегии U 0 ( )⋅ , для которой почти всюду на отрезке ⎡⎣t00,T 0 ⎤⎦ выполняется равенство
x0 ( )t = A t x( ) 0 (t)+ B t U( ) 0 (t)+C t( ). (6)
Пусть t ∈(t T0, 0 ) – точка, где функция x0 (⋅) имеет производную. Для достаточно больших номеров s =1,2, и малых положительных чисел h будет
выполнено вложение [t t, + h]⊂ ⎡⎣t0s ,T s ⎤⎦ . Из равенства
t t t
x( )
t0∗ t0∗ t0∗
следует
x(s) (t + hh)− x(s) (t) = 1h t h+t ⎡A( )τ x( )s ( )τ + B( )τ U s ( )τ +C( )τ ⎤⎦dτ. (7) ∫ ⎣В силу равномерной сходимости последовательности функций {x( )s ( )⋅ } к функции x0 ( )⋅ , для любого ε> 0 и достаточно малого h > 0 , начиная с некоторого номера s , будет выполняться включение
A( )τ x(s) ( )τ + B( )τ U s (τ)+C(τ)∈K x( 0 (t),ε),τ∈[t t, + h],
где
K x( 0 ( )t ,ε) = A t x( ) 0 (t)+ B t P( ) +C t( )+O(0,ε).
Множество K x( 0 (t),ε) является выпуклым компактом. Тогда по лемме 2 следует, что
1 t h+ s s 0
h t ⎣A( )τ x ( )τ τ τ τ τ+ B( )U ( )+C( )⎤⎦d ∈K x( ( )t ,ε). ∫ ⎡Отсюда и из равенства (7) выводим
x(s) (t + h)− x(s) (t) 0
∈ A t x( ) ( )t + B t P( ) +C t( )+O(0,ε). hПереходя в нем к пределу при s → ∞, получим
x0 (t + h)− x0 (t) 0
∈ A t x( ) ( )t + B t P( ) +C t( )+O(0,ε). (8)
h
Из существования производной функции x0 (⋅) в точке t вытекает возможность предельного перехода в левой части равенства (8) при h → 0. В результате такого перехода получим
x0 ( )t ∈ A t x( ) 0 (t)+ B t P( ) +C t( )+O(0,ε).
Отсюда в силу произвольности ε> 0 выводим
x0 ( )t ∈ A t x( ) 0 (t)+ B t P( ) +C t( ).
Итак, установлено, что для каждого момента времени t ∈⎡⎣t00,T 0 ⎤⎦, в который существует производная функции x0 (⋅), найдется вектор u0( )t ∈P, удовлетворяющий равенству (6). По лемме об измеримом выборе [31] функция u0 (⋅) может быть выбрана интегрируемой по Лебегу. Допустимую программную стратегию U 0 ( )⋅ отождествим с функцией u0 (⋅).