Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 19 из 49)

T

+ x0, XТр[T t l, 0 ] 0+ ∫ B( )τ U 0 ( )τ , XТр[T,τ τ]ld +

t0

C( )τ , XТр[t,τ τ]l0d > −max m l, 0 + x0, XТр[T t l, 0 ] 0+

m M

0

T T

+∫minu P
B( )τ u X, Тр[T,τ τ]l0d + ∫
C( )τ , XТр[t,τ τ ε]l0d = 0 .

t0 t0

Получили противоречие. Теорема доказана.

Очевидно (см. рис. 7), что

0 {x0 ( )T }k m0 l =.

{x0 ( )T }k m0

Представим функцию Φ в виде

Φ( )x = minm M∈ { }x k m,{ }x k m =

= { }x k m0 ( ) { }x , x k m0 ( )x ,

Рис. 7 xRn .

Из теоремы 3 следует, что

⎧∂Φ(x)⎫

⎨ ⎬ =

⎩ ∂x k

⎧ ∂ ⎫ {x} −m0 (x) {x} −m0 ( )x


= ⎨ { }x k m,{ }x k m m m= 0 x ⎬ = 0 k 0 = k 0 = l0 .

⎩∂x ( ) ⎭k { }x k m ( ) { }x , x k m ( )x { }x k m ( )x

При x = x0 ( )T отсюда выводим

∂Φ(x0 ( )T )⎫{x0 (T )}k m0 (x0 (T )) 0 ∂Φ(x0 ( )T ) 0∗

⎨ ⎬ = 0 0 0 = l ⇒ = l .

⎪⎩ ∂x ⎪⎭k {x ( )T }k m (x ( )T ) ∂x

Тогда условие (5) эквивалентно следующему:

0 ТрТр ∂Φ(x0 ( )T )

B( )t U ( )t , −X [T t, ]= maxB t u( ) , −X [T t, ], t∈[t T0, ].

u P∈∂x

В силу равенства

0 Тр ∂Φ(x0 (T ))

ψ ( )t = −X [T t, ] , t∈[t T0, ]

x

необходимые условия оптимальности программного управления, доказанные в теореме 6, совпадают с аналогичными условиями принципа максимума Л.С. Понтрягина (теорема 1). Из теоремы 5 также следует, что если величина Φ(x0 ( )T ), вычисленная в результате интегрирования исходной системы дифференциальных уравнений после подстановки в нее программного управления, определенного из условия (4), совпадает с величиной ε0 , вычисленной по формуле (5), то это программное управление является оптимальным.

Пример 4. Рассмотрим линейный управляемый динамический объект из примера 1. Терминальный критерий качества Φ( )x = x12 +(x2 −2)2можно трактовать как расстояние в конечный момент времени от фазового вектора

⎛ ⎞0 до точки m = ⎜ ⎟. Для данного примера выполнены равенства

⎝ ⎠2

⎛1 k = 2, X t[ ,τ] = ⎜

⎝0 Последовательно вычисляем

0⎞ ⎟, 1⎠ ⎛1 B t( ) = ⎜ ⎝0 T 0⎞ 0∗ 0 , l = l . 1⎠

∫minu P
X T[ ,τ τ]B( )u l d, 0 τ=

t0

⎤ ⎡ 1

dτ⎥ = maxl=1 ⎢−2l2 − ∫( l1 + l2 )dτ⎥ =

⎦⎥⎣ 0 ⎦

l10 ⎞ ⎛ 0 ⎞

=1 ⎤ =1, ⎜ 0 ⎟ = ⎜ ⎟ . l l2 ⎠ ⎝−1⎠

Необходимые условия оптимальности программного управления здесь принимают вид

u

t sign l u t sign l t . (7)

В силу l10 = 0 условия(7) определяют программную стратегию неоднозначно. В частности, им удовлетворяет стратегия

U

t u d t .

⎝ 1 ⎠ 0

При этом

I U0 (⋅)⎤ =1=ε0 .

Следовательно, стратегия U 0 (⋅) является оптимальной.

Приведем последовательность действий по решению задачи управления динамической системой на основе теоремы 5.

В начале строится фундаментальная матрица Коши для однородной системы дифференциальных уравнений и вычисляется опорная функция χ(M, )⋅ целевого множества M по формуле

χ(M l, ) = maxm Mm l, , l S(0,1).

Далее для произвольного l S(0,1) решается задача математического программирования

l

⎜ ⎟

Tр Тр 0

B ( )t X [T t, ]⎜ ⎟, u→ min, uP. (8)

⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠

По теореме Вейерштрасса минимум в левой части равенства (8) существует для любой пары (t l, )∈[t T0, ]×S(0,1). Таким образом, определена векторфункция

Uˆ :[t T0, ]×S (0,1) → P, (9)

которая каждой паре (t l, )∈[t T0, ]×S(0,1) ставит в соответствие вектор U t lˆ ( , )∈P , доставляющий минимум в условии (8). Явная запись этой функции возможна для частных случаев управляемой системы, рассмотренных в предыдущем пункте. Пусть функция Uˆ уже построена. Тогда приходим к следующей задаче математического программирования:

l ⎞⎛ l

⎜ ⎟⎜ ⎟

Тр 0Tр Тр 0 ε( )l = −χ(M l, )+[T t, 0 ]⎜ ⎟ U (τ,l), B ( )t X [T,τ]⎜ ⎟dτ+

⎜ ⎟⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠⎜⎜⎝ 0 ⎟⎟⎠

C( )τ , XТр[dτ→ max , l=1. (10)

Эта задача всегда имеет решение, а в случае когда ε ε0 = ( )l0 > 0 , ее решение единственное. Заметим, что приведенная задача математического программирования осложнена наличием определенных интегралов в выражении для целевой функции. Эти интегралы обычно не берутся

аналитически даже, если функция Uˆ определена явно.

Пусть ε0 > 0 и l0 S(0,1) - максимизирующий вектор. Тогда программное управление, удовлетворяющее необходимому условию оптимальности, определяется по формуле

U 0 (⋅) =Uˆ (⋅,l0 ). (11)

После подстановки этого управления в исходные дифференциальные уравнения движения объекта, последние могут быть проинтегрированы с заданными начальными условиями. Далее проверяется справедливость равенства

ε0 = I U0 (⋅)⎤.

В случае его выполнения программная стратегия, определенная равенством (11), является оптимальной.