Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 11 из 49)

3) множество допустимых наборов G ={(t T x U0, , 0, ( )⋅ , x( )⋅ )} содержит хотя бы один элемент;

4) множество допустимых программных стратегий принадлежит пространству функций, интегрируемых по Лебегу на интервале управления.

Тогда существует допустимый набор

t T x U x G , на котором

функционал I достигает минимума.

Доказательству теоремы предпошлем лемму.

Лемма 2. Пусть R:[t0,t]→ K Rn – интегрируемая по Лебегу функция и множество K - выпуклый компакт. Тогда

1 t

R( )τ dτ∈K . (1)

t t0 t0

Доказательство. Известно [16], что для всякой интегрируемой по Лебегу функции R , определенной на интервале [t0 ,t], найдется последовательность ступенчатых функций { }Rs , определенных и равномерно сходящихся на этом интервале к функции R , причем справедливо равенство

t t

( ) R( )τ dτ. (2)

t0 t0

Покажем, что включение (1) справедливо для всякой ступенчатой функции

R:[t0 ,T]→ K . Напомним, что функция называется ступенчатой, если она принимает конечное число значений R(1), ,R(k) K . Обозначим

Tj = {τ∈[t0,t]

R(τ) = R( j)}, j =1, ,k .

Тогда

1 t
R( )τ dτ= . (3)

t t0 t0 t t0 j=1

Здесь µ(T j ) – мера множества T j , j =1, ,k . Заметим, что

. t

Выражение (3) представляет собой выпуклую комбинацию векторов R( j) K , j =1, ,k . Отсюда следует справедливость включения (1) для случая, когда функция R ступенчатая. Доказательство общего случая использует предельный переход в (2) и условие компактности множества K .

Доказательство теоремы. B силу компактности множества Ξ функционал I ограничен на множестве допустимых наборов G . Из условия G ≠∅ следует существование для функционала I минимизирующей последовательности {(t0s ,T s ,x U0s , s ( )⋅ ,xs ( )⋅ )}, (t0s ,T s ,x U0s , s ( )⋅ ,xs (⋅))∈G , s =1,2, , т.е. такой последовательности, что

lims→∞ I t T⎣ 0s , s ,x U0s , s ( )⋅ ,xs ( )⋅ = (t T x U0, , 0inf, ( )⋅ ,x( )⋅ ∈) G I t T x U0, , 0, ( )⋅ ,x(⋅)⎤ = I, I< ∞ .

В силу 2) из последовательности {(t T0s , s , x x0s , s (T s ))}, s =1,2, можно извлечь сходящуюся. Не теряя общности, считаем, что

{(t T0s , s , x x0s , s (T s ))} → (t T00, 0, x00,xT0 )∈Ξ .

Рассмотрим последовательность движений

{x( )s ( )⋅ }, x( )s ( )⋅ = x(⋅,t0s , x U0s , s ( )⋅ ), s =1,2,

Для всех номеров s =1,2, справедливо равенство

t t

x( )s ( )t = X t t⎢⎣ , 0s x0s +∫t X t[ ,τ] ( )B τ U s ( )τ τd +∫t X t[ ,τ] ( )C τ τd , t t0s ,T s . (4)

0 0

Полагаем

⎧⎪ x0s , t ∈⎡⎣t0∗,t0s ) , x( )s ( )t = x( )s ( )t , t ∈⎡t0s ,T s , (5)

⎪ ( )s s s

x (T ), t∈(T ,T .

Из компактности множеств Ξ, P и формул (4) (5) следует, что функции, образующие последовательность {x( )s ( )⋅ }, равномерно ограничены и равностепенно непрерывны на отрезке t0,T . По теореме Арцела (при необходимости следует перейти к подпоследовательности) эта последовательность равномерно сходится на отрезке t0,T к некоторой абсолютно непрерывной функции x0( )⋅ . Очевидно, что

x

.

Обозначим через x0 ( )⋅ сужение функции x0(⋅) на отрезке t00,T 0 и докажем существование допустимой программной стратегии U 0 ( )⋅ , для которой почти всюду на отрезке t00,T 0 выполняется равенство

x0 ( )t = A t x( ) 0 (t)+ B t U( ) 0 (t)+C t( ). (6)

Пусть t ∈(t T0, 0 ) – точка, где функция x0 (⋅) имеет производную. Для достаточно больших номеров s =1,2, и малых положительных чисел h будет

выполнено вложение [t t, + h]⊂ ⎡t0s ,T s . Из равенства

t t t

x( )

t0∗ t0∗ t0∗

следует

x(s) (t + hh)− x(s) (t) = 1h t h+t A( )τ x( )s ( )τ + B( )τ U s ( )τ +C( )τ ⎤⎦dτ. (7) ∫ ⎣

В силу равномерной сходимости последовательности функций {x( )s ( )⋅ } к функции x0 ( )⋅ , для любого ε> 0 и достаточно малого h > 0 , начиная с некоторого номера s , будет выполняться включение

A( )τ x(s) ( )τ + B( )τ U s (τ)+C(τ)∈K x( 0 (t),ε),τ∈[t t, + h],

где

K x( 0 ( )t ,ε) = A t x( ) 0 (t)+ B t P( ) +C t( )+O(0,ε).

Множество K x( 0 (t),ε) является выпуклым компактом. Тогда по лемме 2 следует, что

1 t h+ s s 0

h t A( )τ x ( )τ τ τ τ τ+ B( )U ( )+C( )⎤d K x( ( )t ,ε).

Отсюда и из равенства (7) выводим

x(s) (t + h)− x(s) (t) 0

A t x( ) ( )t + B t P( ) +C t( )+O(0,ε). h

Переходя в нем к пределу при s → ∞, получим

x0 (t + h)− x0 (t) 0

A t x( ) ( )t + B t P( ) +C t( )+O(0,ε). (8)

h

Из существования производной функции x0 (⋅) в точке t вытекает возможность предельного перехода в левой части равенства (8) при h → 0. В результате такого перехода получим

x0 ( )t A t x( ) 0 (t)+ B t P( ) +C t( )+O(0,ε).

Отсюда в силу произвольности ε> 0 выводим

x0 ( )t A t x( ) 0 (t)+ B t P( ) +C t( ).

Итак, установлено, что для каждого момента времени t ∈⎡t00,T 0 , в который существует производная функции x0 (⋅), найдется вектор u0( )t P, удовлетворяющий равенству (6). По лемме об измеримом выборе [31] функция u0 (⋅) может быть выбрана интегрируемой по Лебегу. Допустимую программную стратегию U 0 ( )⋅ отождествим с функцией u0 (⋅).