Методы оптимизации (стр. 3 из 11)

Рассмотрим случай, когда уравнения связи (10) могут быть разрешены относительно части переменных. Будем предполагать, что функции g_i(x), i=l,..., т,имеют в окрестности рассматриваемой допустимой точки

непрерывные частные производные по всем аргументам до второго порядка включительно и, кроме того, ранг матрицы Якоби для функций g_i(x), i = l, ...,m, рассматриваемой в точке

,равен т.Не нарушая общности, предположим, что отличен от нуля определитель (якобиан), составленный из частных производных по первым т аргументам, т. е.

(11)

Тогда по теореме о неявных функциях в некоторой окрестности точки

система уравнений (10) разрешима относительно х¹, ..., х^т,т. е. представима в виде

j=1, 2, …, m,(12)

где

- непрерывно дифференцируемые в рассматриваемой окрестности функции. Переменные х^т+1,..., х^пестественно назвать «независимыми», в отличие от «зависимых»— x¹, ..., х^т. Подставляя выражения (12) в функцию f(x), получим задачу отыскания безусловного экстремума функции п — т переменных

Однако провести исключение части компонент вектора х обычно бывает трудно или даже невозможно. Поэтому мы используем другой путь определения точки

,который не предполагает наличия явных выражений типа (12), хотя использует существенно условие (11).

2.2 Метод множителей Лагранжа. Как мы видели в замечании к теореме 2, в точке

, доставляющей безусловный экстремум функции, ее полный дифференциал равен нулю, т. е.

(13)

где dx^j,j=1, ..., m, — дифференциалы «зависимых» переменных, связанные с дифференциалами «независимых» переменных dx^k, k = m+1, ..., n, следующим образом:

i = l, …, m. (14)

Метод Лагранжа состоит из следующих этапов:

1) составляется функция п+т переменных, которая называется функцией Лагранжа:

(15)

2) вычисляются и приравниваются нулю ее частные производные по хи

j=1, 2, …, n, (16)

i=1, 2, …, m,

3) решается система (16) п+т уравнений относительно п+т неизвестных x¹, ..., х^п,

₁, ...,

_т.

Система уравнений (16) представляет собой необходимые условия первого порядка в задаче на относительный экстремум, а ее решения

¹, ...,

^ппринято называть условно-стационарными точками. Как и в случае задач на безусловный экстремум, необходимые условия первого порядка не определяют характера условно-стационарной точки. Для выяснения этого вопроса следует привлечьпроизводные более высоких порядков функций f(х) и g(x).

Заметим, что требование неравенства нулю якобиана (11) является существенным.

Пример 1. Условие (11) может быть не выполнено, если решение задачи на относительный экстремум реализуется, например, в точке касания поверхностей ограничений (10) (начало координат на рис. 1).

Рис. 1

Пусть

п = 2, т = 2, f(х) = х²,

Допустимая точка должна одновременно удовлетворять уравнениям g₁(x) = 0, g₂(x) = 0 и является единственной: х¹=0, x²= 0. Очевидно, что точка

¹=0,

²=0 и будет решением задачи на относительный минимум функции f(х) = x² при ограничениях g₁(x) = g₂(x) = 0. Составим для этой задачи функцию Лагранжа:

Метод множителей Лагранжа приводит к уравнениям

Этим уравнениям точка относительного минимума

¹=0,

²=0не удовлетворяет ни при каких значениях

₁,

₂,т. е. в данном случае метод множителей Лагранжа не работает.

Пример 2.Пусть

п = 2, т = 2, f(х) = х²

min,

g(x)= х²-(x¹)².

Функция Лагранжа для этой задачи имеет вид

Соответственно, правило множителей Лагранжа приводит к уравнениям

решением которых будет

¹=0,

²=0. Чтобы понять, доставляет точка

=0 относительный минимум функции f(х) илинет, надо выяснить характер поведения квадратичной формы

на прямой

При

, как функция одной переменной

, эта форма положительно определена. Значит, в точке

=0 имеем относительный минимум.

2.3 Седловая точка функции Лагранжа. Рассмотрим функцию двух переменных z = Ф(х, у),где х, y —скаляры или векторы.

Определение. Назовем пару {х*, y*}седловой точкой функции Ф (х, у), если для любых х, yсправедливо неравенство

(17)

Очевидно, что неравенство (17) эквивалентно выражению

Снова рассмотрим задачу отыскания относительного экстремума функции f(x) при ограничениях g(x) = 0. Необходимые условия экстремума (3.10) можно записать в виде

(18)

т. е. пара

является стационарной точкой функции Лагранжа

Однако в этой точке функция

не может достигать максимума или минимума по х и

одновременно. В самом деле, пусть в точке

достигается максимум функции

по х и

. Так как условия связи в точке

выполнены, то

Пусть, далее, в некоторой точке

нарушено одно из ограничений, например

Тогда в силу линейности функции Lпо

мы можем за счет выбора

добиться бесконечно большого значения L(число

имеет знак, противоположный знаку g_k(x)). Следовательно, в точке

функция Лагранжа не может иметь максимума по

. Аналогично можно показать, что в точке

не может одновременно достигаться минимум функции Лагранжа по х и