Экстремумы функций (стр. 7 из 9)

Для отыскания точек условного экстремума следует рассмотреть систему n+m уравнений (6.3) и (6.8) относительно неизвестных x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾, ₁,…, _m и решить ее (если это возможно) , найдя x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾ и по возможности исключив ₁,…, _m.Сформулированная теорема утверждает , что все точки условного экстремума будут находится среди найденных таким образом точек (x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾).Вопрос о том , какие же из них фактически будут точками условного экстремума , требует дополнительного исследования , об этом будет говориться в п.6.5

Доказательство теоремы . Докажем утверждение равносильное теореме : если в точке x⁽⁰⁾=(x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾), удовлетворяющей уравнениям связи

f_k(x⁽⁰⁾)=0 k=1,2,…,n (6.13)

градиенты f₀, f₁, f₂,…, f_m линейно независимы , то x⁽⁰⁾не является точкой условного экстремума.

Итак , пусть f₀, f₁, f₂,…, f_m линейно независимы и , следовательно , ранг матрицы Якоби f_j/ x_i j=1,2,…,m,i=1,2,…,n равен m+1.Тогда в матрице существует минор порядка m+1 не равный нулю.Для определенности будем считать , что он образован первыми m+1 столбцами , т.е.

(f₀, f₁, f₂,…, f_m)

(x₁,x₂,…,x_m+1) x=x⁽⁰⁾ (6.14)

Множество G–открыто , а поэтому существует такое 0₀>0, что при всех 0 0<0<0₀, куб

Q ⁿ={x: x_i-x_i⁽⁰⁾ <0,i=1,2,…,n}

лежит в G и , следовательно, на нем определены все функции f₀, f₁, f₂,…, f_m.

Зафиксируем x_m+2= x⁽⁰⁾_m+2,…, x_n=x_n⁽⁰⁾и введем обозначения

x^*=(x₁,x₂,…,x_m+1)

Q^m+1={x^*: x_i-x_i⁽⁰⁾ <0,i=1,2,…,m+1}

Очевидно , функции f_j(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾) j=1,2,…,m определены и непрерывно дифференцируемы всюду в Q^m+1.Рассмотрим отображение Ф : Q^m+1 R^m+1, задаваемое формулами

y₁= f₀(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾)

y₂= f₁(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾)

…………………………………… (6.15)

y_m+1= f_m(x₁,x₂,…,x_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾)

В силу (6.15) для точки x^*(0)=(x₁⁽⁰⁾,x₂⁽⁰⁾,…,x_n⁽⁰⁾) имеем

(y₁, y₂,…, y_m+1) (f₀, f₁, f₂,…, f_m)

(x₁,x₂,…,x_m+1) x^*= x^*(0)(x₁,x₂,…,x_m+1)x=x⁽⁰⁾

а в силу (6.13) Ф(x^*(0))=(f₀(x⁽⁰⁾,0,…,0) .Поэтому (в силу теремы о локальной обратимости непрерывно дифференцируемого отображения в точке , в которой его якобиан не равен нулю , существует такое число >0 , что на окрестности

V={y=(y₁, y₂,…, y_m+1) : y₁- f₀(x⁽⁰⁾) < , y_j< ,j=2,3,…,m}

В частности , поскольку при любом n,0<n< ,имеет место включение (f₀(x⁽⁰⁾)+n,0,…,0), то в кубе найдутся точки x`^*=(x`₁,x`₂,…,x`_m+1) и x``^*=(x``₁,x``₂,…,x``_m+1), отображающиеся при отображении Ф в указанные точки окрестностиV`.

Ф(x`^*)=(f₀(x⁽⁰⁾)+n,0,…,0)

Ф(x``^*)=(f₀(x⁽⁰⁾)-n,0,…,0)

Если положим для краткости x`=(x`₁,x`₂,…,x`_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾) и x``=(x``₁,x``₂,…,x``_m+1,x⁽⁰⁾_m+2,…,x_n⁽⁰⁾), то в координатной записи (6.15) получим

f₀(x`)= f₀(x⁽⁰⁾)+n> f(x⁽⁰⁾) , f_k(x`)=0, k=1,2,…,n , x` Q ⁿ

f₀(x``)= f₀(x⁽⁰⁾)-n> f(x⁽⁰⁾) , f_k(x``)=0, k=1,2,…,n , x`` Q ⁿ

В силу произвольности 0>0,0<0<0 , это и означает , что x⁽⁰⁾не является точкой условного экстремума.

ч.т.д.

Доказательство следствея. Если векторы f₁, f₂,…, f_m линейно независимы , то в равенстве (6.8) имеем ₀=0 так как в случае ₀=0 указанные векторы в силу (6.8) оказались бы линейно зависимыми .Разделив обе части на ₀ получим равенство вида (6.9).

ч.т.д.

Пример №5.

Пусть требуется найти экстремум функции u=xyzt при условии x+y+z+t=4c; область изменения переменных определяетссся неравенствовами x>0, y>0, t>0, z>0.

Применяя к этой задаче метод Лагранжа, введем вспомогательную функцию

Ф=xyzt+ (x+y+z+t)

И составим условия

Ф_x=yzt+ =0

Ф_y=xzt+ =0

Ф_z=yxt+ =0

Ф_t=yzx+ =0

откуда

yzt=xzt=xyt=xyz

так что

x=y=z=t=c.

6.4.Стационарные точки функции Лагранжа.

В этом пункте будет дано описаие стационарных точек функции Лагранжа (6.10) посредством фукции 0(x_m+1,x_m+2,…,x_n), введенной в пункте 6.2 (см.(6.8)).Предварительно докажем одну простую лемму из линейной алгебры.

Пусть задана система линейных однородных уравнений

a_i1x₁+…+ a_inx_n=0 i=1,2,…,m (6.16)

и еще одно линейное однродное уравнение

b₁x₁+…+ b_nx_n=0 (6.17)

Cистему уравнений , полученную присоединением к системе (6.16) уравнения (6.17), будем называть расширенной системой (6.16)-(6.17).

Лемма: Для того чтобы расширенная система (6.16)-(6.17) была равносильна основной системе (6.16) необходимо и достаточно , чтобы уравнение (6.17) являлось линейной комбинацией уравнений системы (6.16).

Следствие:Для того чтобы уравнение (6.17) было линейной комбинацией уранений (6.16) или , что то же самое , чтобы вектор

b==(b₁,…,b_n) (6.18)

был линейной комбинацией векторов

a_i ==(a_i1,…,a_in) i=1,2,…,m (6.19)

необходимо и достаточно , чтобы каждое решение системы (6.16) являлось решением уравнения (6.17).

Доказательство леммы . Пусть ранг матрицы (a_ij) коэффициентов системы (6.16) равен m₀ . Очевидно , что m₀<m . Если m₀<m, то уравнений системы (6.16) являются линейными комбинациями остальных. Отбросив те m-m₀ линейных уравнений , которые являются линейными комбинациями оставшихся , получили систему из m₀линейно независимых уравнений . равносильную системе (6.16), причем уравнение (6.17) является линейной комбинацией уравнений системы (6.16) тогда и только тогда , когда оно является линейной комбинацией указанной системы из оставшихся m₀ уравнений. Поэтому будем с самого начала считать , что , m₀=m т.е. что ранг матрицы (a_ij) коэффициентов системы (6.16) равен m– числу уравнений этой системы.

Пусть система (6.16) и (6.16)-(6.17) равносильны. Это означает, что пространства их решений совпадают.Поскольку все уравнения основной системы (6.16) входят в расширенную систему (6.16)-(6.17), то каждое решение расширенной системы является и решением основной системы , т.е. пространство решений расширенной системы содержится в пространстве решений основной системы. Следовательно , слвпадение этих пространств равносильно равенству их размерностей.

Размерность s пространства решений системы линейных днородных уравнений равны , как известно , числу неизвестных n этой системы , из которого вычтем ранг r матрицы коэффициентов системы : s=n-r.Отсюда следует , что равносильность систем (6.16) и (6.16)-(6.17) означает равенство рангов их матриц.Ранг матрицы коэффициентов системы (6.16) по условию равен m , т.е. векторы (6.19) линейно независимы.

Ранг матрицы коэффициентов расширенной системы (6.16)-(6.17) согласно сказанному в наших условиях также равен m.Поэтому векторы (см.(6.18) и (6.19))

b, a₁,…, a_m (6.20)

линейно зависимы.А это означает , что b является линейной комбинацией векторов a₁,…, a_m.

В самом деле , линейная зависимость векторов (6.20) означает , что существуют такие числа _{0, 1},…, _m, не все равные нулю . что

₀b+ ₁a₁+…+ _ma_m=0 (6.21)

Здесь заведамо ₀=0, так как в противном случае векторы a₁,…, a_m оказались бы линейно зависимыми. Поделив равенство (6.21) на ₀, получим , что b является линейной комбинацией векторов a₁,…, a_m .

Обратно, если b является линейной комбинацией векторов (6.19), то в системах векторов (6.19) и (6.20) имеется в точности по m линейно независимых векторов , т.е. ранги матриц коэффициентов систем уравнений (6.16) и (6.16)-(6.17) равны.

Итак, условие , что вектор b является линейной комбинацией векторов (6.19) :

₁a₁+…+ _ma_m=b

эквивалентно равенству рангов матриц коэффициентов рассматриваемых основной и расширенной системв уравнений, следовательно, эквивалентно их равносильности.

ч.т.д.

Доказательство следствия сразу следует из леммы, поскольку системы (6.16) и (6.16)-(6.17) очевидно равносильны тогда и только тогда , когда каждое решение системы (6.16) является и решением уравнения (6.17) – остальные уравнения систем просто совпадают.

ч.т.д.

Замечание 1 : доказанная лемма и ее следствие имеют простую геометрическую интерпритацию в n–мерном евклидовом векторном пространстве Rⁿ, т.е. в n–мерном пространстве со скалярным произведением.Используя обозначение скалярного произведения, систему (6.16) можно записать в виде

(a_i,x)=0 i=1,2,…,m (6.22)

а уравнение (6.17) в виде

(b,x)=0 (6.23)

где векторы a₁,…, a_m и определены в (6.18) и (6.19) , а x=(x₁,x₂,…,x_m+1)

Множество всевозможных линейных комбинаций векторов a₁,…, a_m образуют подпространство пространства Rⁿ и называется подпространством, натянутым на эти векторы.Обозначим его через Z=( a₁,…, a_m).

Множество решений системы (6.22) состоит из всех векторов х, ортоганальных подпространству Z=( a₁,…, a_m) Обозначим это множество решений через Т.Оно также является подпространством пространства Rⁿ.

Подпространства L==Z(a₁,…, a_m) и Т называются ортоганальными дополнениями друг друга в пространстве Rⁿ.

Поскольку L=Z( a₁,…, a_m), то представимость вектора b в виде линейной комбинации векторов a₁,…, a_m равносильна его принадлежности подпространству L пространства Rⁿ:b L.Это условие в свою очередь, равносильно ортоганальности вектора b подпространству Т:b _Т, которая означает, что для всех x Т имеет место равенство (b,x)=0,т.е.что любое реение х системы (6.22) является решением уравнения (6.23).Это и является утверждением следствия леммы.