При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим
где
Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений
>В более подробной покоординатной записи сопряженная система принимает вид
Система (2.3) имеет при любых начальных условиях единственное решение
Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).
Теорема (принцип максимума Понтрягина).
Пусть функции
|
а) (условие максимума) при каждом t
H(x(t), u(t),
б)(условие трансверсальности на левом конце траектории) существуют числа
в) (условие трансверсальности на правом конце траектории) существуют числа
Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием
и добавить еще одно условие трансверсальности на правом конце траектории:
Примеры применения принципа максимума.
1. Простейшая задача оптимального быстродействия.
Пусть точка движется по прямой в соответствии с законом
где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию
Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные
Начальное положение
при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.
В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид
Общее решение сопряженной системы
легко выписывается в явном виде
где С, D - постоянные.
Очевидно, что максимум функции Н по и U достигается при
Таким образом, оптимальное управление и может принимать лишь два значения +1 .
2.Определить управление u(t) , которое дает минимум интегралу
Для этой переменной имеем дифференциальное уравнение
с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2), можно записать в виде I[T]=x2(T).
Построим функцию Гамильтона
Запишем сопряженную систему
Запишем
Y1(Т)=0 (т.к. с1=0)
Y2(Т)=-1
Из
По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u :
Осталось решить систему уравнений (2) и (3) при условии
Сведем данную систему к одному уравнению относительно U.