Для отыскания точек условного экстремума следует рассмотреть систему n+m уравнений (6.3) и (6.8) относительно неизвестных x1(0),x2(0),…,xn(0), 1,…, m и решить ее (если это возможно) , найдя x1(0),x2(0),…,xn(0) и по возможности исключив 1,…, m.Сформулированная теорема утверждает , что все точки условного экстремума будут находится среди найденных таким образом точек (x1(0),x2(0),…,xn(0)).Вопрос о том , какие же из них фактически будут точками условного экстремума , требует дополнительного исследования , об этом будет говориться в п.6.5
Доказательство теоремы . Докажем утверждение равносильное теореме : если в точке x(0)=(x1(0),x2(0),…,xn(0)), удовлетворяющей уравнениям связи
fk(x(0))=0 k=1,2,…,n (6.13)
градиенты f0, f1, f2,…, fm линейно независимы , то x(0) не является точкой условного экстремума.
Итак , пусть f0, f1, f2,…, fm линейно независимы и , следовательно , ранг матрицы Якоби fj/ xi j=1,2,…,m,i=1,2,…,n равен m+1.Тогда в матрице существует минор порядка m+1 не равный нулю.Для определенности будем считать , что он образован первыми m+1 столбцами , т.е.
(f0, f1, f2,…, fm)
(x1,x2,…,xm+1) x=x(0) (6.14)
Множество G–открыто , а поэтому существует такое 00>0, что при всех 0 0<0<00 , куб
Q n={x: xi-xi(0) <0,i=1,2,…,n}
лежит в G и , следовательно, на нем определены все функции f0, f1, f2,…, fm.
Зафиксируем xm+2= x(0)m+2,…, xn=xn(0)и введем обозначения
x*=(x1,x2,…,xm+1)
Q m+1={x*: xi-xi(0) <0,i=1,2,…,m+1}
Очевидно , функции fj(x1,x2,…,xm+1,x(0)m+2,…,xn(0)) j=1,2,…,m определены и непрерывно дифференцируемы всюду в Q m+1.Рассмотрим отображение Ф : Qm+1 Rm+1, задаваемое формулами
y1= f0(x1,x2,…,xm+1,x(0)m+2,…,xn(0))
y2= f1(x1,x2,…,xm+1,x(0)m+2,…,xn(0))
…………………………………… (6.15)
ym+1= fm(x1,x2,…,xm+1,x(0)m+2,…,xn(0))
В силу (6.15) для точки x*(0)=(x1(0),x2(0),…,xn(0)) имеем
(y1, y2,…, ym+1) (f0, f1, f2,…, fm)
(x1,x2,…,xm+1) x*= x*(0)(x1,x2,…,xm+1)x=x(0)
а в силу (6.13) Ф(x*(0))=(f0(x(0),0,…,0) .Поэтому (в силу теремы о локальной обратимости непрерывно дифференцируемого отображения в точке , в которой его якобиан не равен нулю , существует такое число >0 , что на окрестности
V={y=(y1, y2,…, ym+1) : y1- f0(x(0)) < , yj< ,j=2,3,…,m}
В частности , поскольку при любом n,0<n< ,имеет место включение (f0(x(0))+n,0,…,0), то в кубе найдутся точки x`*=(x`1,x`2,…,x`m+1) и x``*=(x``1,x``2,…,x``m+1), отображающиеся при отображении Ф в указанные точки окрестностиV`.
Ф(x`*)=(f0(x(0))+n,0,…,0)
Ф(x``*)=(f0(x(0))-n,0,…,0)
Если положим для краткости x`=(x`1,x`2,…,x`m+1,x(0)m+2,…,xn(0)) и x``=(x``1,x``2,…,x``m+1,x(0)m+2,…,xn(0)), то в координатной записи (6.15) получим
f0(x`)= f0(x(0))+n> f(x(0)) , fk(x`)=0, k=1,2,…,n , x` Q n
и
f0(x``)= f0(x(0))-n> f(x(0)) , fk(x``)=0, k=1,2,…,n , x`` Q n
В силу произвольности 0>0,0<0<0 , это и означает , что x(0) не является точкой условного экстремума.
ч.т.д.
Доказательство следствея. Если векторы f1, f2,…, fm линейно независимы , то в равенстве (6.8) имеем 0=0 так как в случае 0=0 указанные векторы в силу (6.8) оказались бы линейно зависимыми .Разделив обе части на 0 получим равенство вида (6.9).
ч.т.д.
Пример №5.
Пусть требуется найти экстремум функции u=xyzt при условии x+y+z+t=4c; область изменения переменных определяетссся неравенствовами x>0, y>0, t>0, z>0.
Применяя к этой задаче метод Лагранжа, введем вспомогательную функцию
Ф=xyzt+ (x+y+z+t)
И составим условия
Фx=yzt+ =0
Фy=xzt+ =0
Фz=yxt+ =0
Фt=yzx+ =0
откуда
yzt=xzt=xyt=xyz
так что
x=y=z=t=c.
6.4.Стационарные точки функции Лагранжа.
В этом пункте будет дано описаие стационарных точек функции Лагранжа (6.10) посредством фукции 0(xm+1,xm+2,…,xn), введенной в пункте 6.2 (см.(6.8)).Предварительно докажем одну простую лемму из линейной алгебры.
Пусть задана система линейных однородных уравнений
ai1x1+…+ ainxn=0 i=1,2,…,m (6.16)
и еще одно линейное однродное уравнение
b1x1+…+ bnxn=0 (6.17)
Cистему уравнений , полученную присоединением к системе (6.16) уравнения (6.17), будем называть расширенной системой (6.16)-(6.17).
Лемма: Для того чтобы расширенная система (6.16)-(6.17) была равносильна основной системе (6.16) необходимо и достаточно , чтобы уравнение (6.17) являлось линейной комбинацией уравнений системы (6.16).
Следствие:Для того чтобы уравнение (6.17) было линейной комбинацией уранений (6.16) или , что то же самое , чтобы вектор
b==(b1,…,bn) (6.18)
был линейной комбинацией векторов
ai ==(ai1,…,ain) i=1,2,…,m (6.19)
необходимо и достаточно , чтобы каждое решение системы (6.16) являлось решением уравнения (6.17).
Доказательство леммы . Пусть ранг матрицы (aij) коэффициентов системы (6.16) равен m0 . Очевидно , что m0<m . Если m0<m, то уравнений системы (6.16) являются линейными комбинациями остальных. Отбросив те m-m0 линейных уравнений , которые являются линейными комбинациями оставшихся , получили систему из m0 линейно независимых уравнений . равносильную системе (6.16), причем уравнение (6.17) является линейной комбинацией уравнений системы (6.16) тогда и только тогда , когда оно является линейной комбинацией указанной системы из оставшихся m0 уравнений. Поэтому будем с самого начала считать , что , m0=m т.е. что ранг матрицы (aij) коэффициентов системы (6.16) равен m– числу уравнений этой системы.
Пусть система (6.16) и (6.16)-(6.17) равносильны. Это означает, что пространства их решений совпадают.Поскольку все уравнения основной системы (6.16) входят в расширенную систему (6.16)-(6.17), то каждое решение расширенной системы является и решением основной системы , т.е. пространство решений расширенной системы содержится в пространстве решений основной системы. Следовательно , слвпадение этих пространств равносильно равенству их размерностей.
Размерность s пространства решений системы линейных днородных уравнений равны , как известно , числу неизвестных n этой системы , из которого вычтем ранг r матрицы коэффициентов системы : s=n-r.Отсюда следует , что равносильность систем (6.16) и (6.16)-(6.17) означает равенство рангов их матриц.Ранг матрицы коэффициентов системы (6.16) по условию равен m , т.е. векторы (6.19) линейно независимы.
Ранг матрицы коэффициентов расширенной системы (6.16)-(6.17) согласно сказанному в наших условиях также равен m.Поэтому векторы (см.(6.18) и (6.19))
b, a1,…, am (6.20)
линейно зависимы.А это означает , что b является линейной комбинацией векторов a1,…, am.
В самом деле , линейная зависимость векторов (6.20) означает , что существуют такие числа 0, 1,…, m, не все равные нулю . что
0b+ 1a1+…+ mam=0 (6.21)
Здесь заведамо 0=0, так как в противном случае векторы a1,…, am оказались бы линейно зависимыми. Поделив равенство (6.21) на 0, получим , что b является линейной комбинацией векторов a1,…, am .
Обратно, если b является линейной комбинацией векторов (6.19), то в системах векторов (6.19) и (6.20) имеется в точности по m линейно независимых векторов , т.е. ранги матриц коэффициентов систем уравнений (6.16) и (6.16)-(6.17) равны.
Итак, условие , что вектор b является линейной комбинацией векторов (6.19) :
1a1+…+ mam=b
эквивалентно равенству рангов матриц коэффициентов рассматриваемых основной и расширенной системв уравнений, следовательно, эквивалентно их равносильности.
ч.т.д.
Доказательство следствия сразу следует из леммы, поскольку системы (6.16) и (6.16)-(6.17) очевидно равносильны тогда и только тогда , когда каждое решение системы (6.16) является и решением уравнения (6.17) – остальные уравнения систем просто совпадают.
ч.т.д.
Замечание 1 : доказанная лемма и ее следствие имеют простую геометрическую интерпритацию в n–мерном евклидовом векторном пространстве Rn, т.е. в n–мерном пространстве со скалярным произведением.Используя обозначение скалярного произведения, систему (6.16) можно записать в виде
(ai,x)=0 i=1,2,…,m (6.22)
а уравнение (6.17) в виде
(b,x)=0 (6.23)
где векторы a1,…, am и определены в (6.18) и (6.19) , а x=(x1,x2,…,xm+1)
Множество всевозможных линейных комбинаций векторов a1,…, am образуют подпространство пространства Rn и называется подпространством, натянутым на эти векторы.Обозначим его через Z=( a1,…, am).
Множество решений системы (6.22) состоит из всех векторов х, ортоганальных подпространству Z=( a1,…, am) Обозначим это множество решений через Т.Оно также является подпространством пространства Rn.
Подпространства L==Z(a1,…, am) и Т называются ортоганальными дополнениями друг друга в пространстве Rn.
Поскольку L=Z( a1,…, am), то представимость вектора b в виде линейной комбинации векторов a1,…, am равносильна его принадлежности подпространству L пространства Rn:b L.Это условие в свою очередь, равносильно ортоганальности вектора b подпространству Т:b _Т, которая означает, что для всех x Т имеет место равенство (b,x)=0,т.е.что любое реение х системы (6.22) является решением уравнения (6.23).Это и является утверждением следствия леммы.