Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 14 из 49)

Распишем подробнее левую часть условия (6). Имеем

b11 ( )t B( )t ψ= ⎜⎜ ⎜b1r ( )t

n b t ψ bn1 ( )t ⎞⎛ψ1 ⎞k=1 k1 ( ) k ⎟⎜ ⎟ = ⎜ ⎟ . bnr ( )t ⎟⎠⎜⎝ψn ⎟⎠ ⎜⎜∑n bkr ( )t ψk ⎟⎟⎟

⎜ ⎝ k=1 ⎠

Тогда задача математического программирования принимает вид

n n u1 ⎞ ⎛ ⎞ ⎛ ⎞ ⎜ ⎟

u1 ⎜∑bk1 ( )t ψk + +ur ⎜∑bkr ( )t ψk → max, ⎜ ⎟P . (7)

k=1 ⎠ ⎝ k=1 ⎠ ⎜ur

По теореме Вейерштрасса максимум в условии (7) существует для любой пары (t,ψ)∈[t T0, ]×Rn . Следовательно, можно определить вектор-функцию

Uˆ :[t T0, ]×Rn P , (8)

которая каждой паре (t,ψ)∈[t T0, ]×Rn ставит в соответствие вектор U tˆ ( ,ψ)∈P , доставляющий максимум в условии (7).

Пусть функция Uˆ уже построена. Рассмотрим систему из 2n обыкновенных дифференциальных уравнений

⎧⎪⎨x = A t x( ) + B t U t( ) ˆ( ,ψ)+C t( ), (10)

⎪⎩ ψ= −A ψ.

относительно 2n неизвестных x,ψ с 2n граничными условиями

x( ) ( )
. (11) x

Заметим, что в общем случае эта система нелинейная. Более того, функция Uˆ может оказаться разрывной по переменной ψ, и тогда для системы дифференциальных уравнений (10) не будут выполняться условия существования решения. В случае, когда все же для задачи (10), (11) получено решение x0 (⋅),ψ0 (⋅), программная стратегия U0 ( )⋅ =Uˆ (⋅,ψ0(⋅)) будет удовлетворять условиям теоремы 1, т.е. являться стратегией подозрительной на оптимальную стратегию.

2.2. Поведение функции Л.С. Понтрягина вдоль оптимальной пары

В предыдущем пункте (теорема 1) было доказано, что функция Понтрягина на оптимальном управлении принимает максимальное значение. Установим ниже некоторые общие свойства функции максимума (минимума).

Пусть F : X ×Y R1, X Rn ,Y Rm – некоторая функция, непрерывная по совокупности своих переменных в каждой точке области определения. При этом множество Y компактное, а множество X – открытое. Положим

F 0(x)= max F(x, y), xX , (1)

yY

Y 0( )x = {y0(x)F(x, y0(x))= F 0(x)}, xX .

Лемма 1. Функция F 0 : X R1 , определенная равенством (1), является непрерывной в каждой точке xX .

Доказательство. Пусть xX . Для всякого xRn , x + ∆xX положим

F 0 (x) = F 0 (x + ∆x)− F 0 (x)= F(x + ∆x, y 0 (x + ∆x))− F(x, y 0 ( )x ).

Справедливо двойное неравенство

F(x + ∆x, y 0 (x))− F(x, y 0 ( )x )≤ ∆F 0 (x) ≤ F(x + ∆x, y 0 (x + ∆x))− F(x, y 0 (x + ∆x)), (2) из которого следует, что F 0 (x) → 0 при x → 0. Лемма доказана.

Определение 1. Будем говорить, что многозначное отображение χ: X → 2Y , где через 2Y обозначено множество всех подмножеств множества Y , называется полунепрерывным сверху по включению в точке xX , если для всякой последовательности {x( )s } → x и {y( )s } → y, y( )s ∈χ(x( )s ), s =1,2, имеет место включение y∈χ(x).

Заметим, что если отображение χ однозначно, т.е. множество χ(x) состоит ровно из одного элемента при всех xX , то из полунепрерывности сверху по включению этого отображения следует его непрерывность в обычном смысле.

Лемма 2. Многозначное отображение Y 0 : X → 2Y полунепрерывно сверху по включению в каждой точке xX .

Доказательство. От противного приходим к существованию точки xX и таких последовательностей

{ }xs x, xs

Y, ys0 Y 0 (xs ), s =1,2 ,

что yY 0 ( )x. Тогда найдется число ε> 0, для которого

F 0 (x)− F(x, y)=ε. (3)

Из непрерывности функций F,F 0 и сходимости последовательностей {xs },{ys } к точкам x, y, соответственно, для достаточно больших номеров s будут справедливы неравенства

F 0 ( )xF 0 ( )xs F(x, y)− F(xs , ys0 ) < ε. (4)

3

Учитывая, что F

, , из соотношений (3),(4) выводим

ε= F 0 ( )xF(x, y)=

F 0 (x)− F(x, y) ≤

F 0 ( )x∗ − F 0 (xs ) + F(xs , ys0 )− F(x∗, y∗) < ε + ε = 2ε<ε.

3 3 3

Получили противоречие, которое и доказывает лемму.

Дополнительно предположим, что функция F непрерывно дифференцируема по переменной x в области X , а множество Y 0 (x) состоит ровно из одного элемента y 0 (x) при всех xX . Тогда, как отмечалось выше, функция y 0 : X Rm будет непрерывной в каждой точке xX .

Теорема 2. В принятых предположениях функция F 0 : X R1 непрерывно дифференцируема в каждой точке области определения и при этом имеет место равенство

∂ 0 ∂∗ 0

F ( )x =
F(x, y ( )x ), xX , (5) ∂x x

где индекс «» в обозначении производной по векторному аргументу x в правой части (5) означает, что эта производная вычисляется без учета зависимости y 0 от xX .

Доказательство. По формуле конечных приращений [7] из двойного неравенства (2) находим

F(x, y 0 (x + ∆x)), ∆x + o x ≤ ∆F 0 ( )x
F(x, y 0 ( )x ), ∆x + o x . (6)

Из соотношений (6) с учетом непрерывности функции y 0 следует, что

F 0 ( )x =
F(x, y 0 ( )x ), ∆x + o x .

Последнее условие означает дифференцируемость функции F 0 в точке xX и справедливость равенства (5). Из непрерывности правой части равенства (5) следует непрерывность и его левой части. Теорема доказана.

Докажем одно важное свойство функции Л.С. Понтрягина.

Теорема 3. Пусть A= const B, = const C, = const и тройка U 0 ( )⋅ ,x0 (⋅),ψ0 (⋅) удовлетворяет условиям теоремы 1. Тогда функция Л.С. Понтрягина