Смекни!
smekni.com

Окремі випадки задач оптимального стохастичного керування (стр. 2 из 3)

– банахів простір всіх обмежених дійсних функцій
з нормою, що визначається за формулою

,
.

Позначатимемо

, якщо
,
,
і
, якщо
,
,
.

Для будь-якої функції

і будь-якого числа
позначимо через
функцію, що приймає значення
в кожній точці
, так, що

,
.

Припущення монотонності. Для будь-яких станів

, керування
і функцій
мають місце нерівності

якщо
і
;

, якщо
і
;

, якщо
,
і
.

Для будь-якого

стратегія
називається
-оптимальною при горизонті
, якщо

і

-оптимальною, якщо

Багато задач послідовної оптимізації, що становлять практичний інтерес, можуть розглядатися як окремі випадки задач загального виду. Розглянемо деякі з них:

· задачі детермінованого оптимального керування;

· задачі стохастичного керування зі зліченним простором збурень;

· задачі стохастичного керування із зовнішнім інтегралом;

· задачі стохастичного керування з мультиплікативним функціоналом витрат;

· задачі мінімаксного стохастичного керування.

2. Детерміноване оптимальне керування

Розглянемо відображення

, що задане формулою

,
,
,
(1)

за таких припущень:

функції

і
відображають множину
відповідно в множини
і
, тобто
,
; скаляр
додатний.

За цих умов відображення

задовольняє припущенню монотонності. Якщо функція
дорівнює нулю, тобто
,
, то відповідна
-крокова задача оптимізації (1) набуває вигляду:

, (2)

. (3)

Ця задача є задачею детермінованого оптимального керування зі скінченним горизонтом. Задача з нескінченним горизонтом має наступний вигляд:


, (4)

. (5)

Границя в (4) існує, якщо має місце хоча б одна з наступних умов:

·

,
,
;

·

,
,
;

·

,
,
,
і деякого
.

У задачі (4) – (5) може бути уведене додаткове обмеження на стан системи

,
. У такому разі, якщо
, позначатимемо
.

3. Оптимальне стохастичне керування: зліченний простір збурень

Розглянемо відображення

, що задане формулою

, (6)

за таких припущень:

параметр

приймає значення зі зліченної множини
з заданим розподілом ймовірностей
, що залежать від
і
; функції
і
відображають множину
відповідно в множини
і
, тобто
,
; скаляр
додатний.

Якщо

,
, – елементи множини
,
– довільний розподіл ймовірностей на
, а
– деяка функція, то математичне сподівання визначається за формулою