Смекни!
smekni.com

Оптимальное управление линейными динамическими объектами (стр. 22 из 49)

x

t l x t l

⎜−

0 0 ⎟

Ε1 (t l, 1 ,l2 ) u t( ) = ⎜⎟, t∈[0,1].

x

t l x t l

⎜⎟

⎝⎠

Здесь

.

Пусть x( )⋅ = x(⋅,t0,x u0, ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛0.703⎞

x2 ( )1 ⎟⎠ = ⎜⎝0.193⎟⎠, I u⎡⎣ ( )⋅ ⎤⎦ = 4.74077 ⎜

Таким образом,

I u⎡⎣ ( )⋅ ⎤⎦ = 4.74077 > 4.596 = I U⎡⎣ 0 (⋅)⎤⎦ .

Пример 8*. В условиях предыдущего примера принимается, что

⎧⎪⎛u1 2⎫⎪ P = ⎨⎜ ⎟∈R≤1⎬.

⎪⎩⎝u2 ⎠⎭⎪

Тогда

0

⎡ 1 ⎤

ε = − +1 l Smax∈ 0,1 ⎢ −(5l1 + 4l2 )− ∫
x13 (1,τ)l1 + x23 (1,τ)l2 + x14 (1,τ)l1 + x24 (1,τ τ)l d2 ⎥.

( )

⎣ 0 ⎦

Вектор- функция Uˆ определяется формулой

U t l lˆ ( , ,1 2 ) = ⎛⎜−sign x⎣⎡ 13 (1,τ)l1 + x23 (1,τ)l2 ⎤⎦⎞⎟, (14)

⎜⎝−sign x14 (1,τ)l1 + x24 (1,τ)l2

а задача математического программирования (8) здесь принимает вид

1

ε( )l = − −1 (5l1 + 4l2 )− ∫ ⎡
x13 (1,τ)l1 + x23 (1,τ)l2 + x14 (1,τ)l1 + x24 (1,τ τ)l2 d → max, l =1.

0

Приведем ее решение

0 ⎛ −0.791⎞ 0

l = ⎜ , ε( )l = 4.282.

⎝−0.612⎠

Подставляя l0 в (12), находим управление

⎛−sign x13 (1,τ)l10 + x23 (1,τ)l20 ⎤⎞

U 0 ( )t t . (15)

⎜⎝−sign x14 (1,τ)l10 + x24 (1,τ)l20 ⎝ ⎠1

Из графиков компонент вектора управления (15), представленных на

рис. 12

U1 U2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Рис. 12.

видно, что оптимальное управление постоянно на всем промежутке времени [0,1]. Оптимальный закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с заданными начальными условиями, в которую подставлено оптимальное программное управление (15). Ниже на рис 13 приводятся графики изменения первых двух координат фазового вектора от времени

Рис. 13

Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до терминального множества задается равенствами

0 x10 ( )1 ⎞ ⎛0.821⎞ 0 0

{x ( )1 }2 = ⎜⎜ x20 ( )1 ⎟⎟= 0.771, I U⎡ ( )⋅ ⎤= ρ({x ( )1 }2 ,M ) = 4.282 .

Вновь подтверждается выполнение равенства

I U 0 (⋅)⎤=ε ε0 = (l0 ).

Найденное расстояние меньше того, что было получено в примере 7. Этот результат ожидаемый, так как область изменения вектора управляющих параметров в рассматриваемом примере шире, чем в примере 7.

Для сравнения вычислим финальное расстояние от проекции фазового вектора на первые две координаты до терминального множества для случая, когда в качестве допустимого программного управления взята вектор- функция

1, 0, 0.1 1, [0, 0.9)

u t = ⎜ ⎟ u1 ( )t = u2 t = .

u2 ( )t ⎠ ⎪⎩ 1 t ∈[0.1,1] ⎪⎩−1 t∈[0.9,1]

Пусть x( )⋅ = x(⋅,t0,x U0, ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛0.499⎞

x2 ( )1 ⎟⎠ = ⎜⎝0.652⎠, I U⎡⎣ ( )⋅ ⎤⎦ = 4.60949 .

Таким образом, I u⎡⎣ ( )⋅ ⎤= 4.60949 > 4.282 = I U0 (⋅)⎤.

2.5. Случай подвижного левого и свободного правого конца траектории. Будем предполагать, что в постановке задачи 1 множество S0 Rn содержит более одной точки и является компактным множеством в Rn . Сформулируем получившуюся задачу.

Задача 2. Найти допустимую программную стратегию U 0 ( )⋅ ∈Π[t T0, ], доставляющую минимум функционалу

I U (⋅)⎤= Φ(x T( )), Φ∈C1 (R1 )

при ограничениях

x = A t x( ) + B t u( ) +C t( ), xRn, uP Rr , θ0 ={t0},θ1 ={T}, x0 S0 Rn, S1 = Rn .

Обозначим

Γ(t S T0, 0, ) = ∪ G t x T( 0, 0 , ).

x0∈S0

Из непрерывной зависимости области достижимости от начального положения x0 S0 (см. формулу Коши) и компактности множества S0 следует, что множество Γ(t S T0, 0, ) ⊂ Rn также является компактным, поэтому решение задачи

2 существует.

Пусть пара

доставляет решение задачи 2.

Очевидно, что программная стратегия U 0 (⋅ ∈Π) [t T0, ] будет оптимальной для задачи 1, если принять S0 ={x00}, а остальные условия задачи 1 считать совпадающими с соответствующими условиями задачи 2. Тогда по теореме 4 должно выполняться

B( )t U 0 (t),ψ0 (t)
= max
B t u( ) ,ψ0 (t)
(1)

u P

для почти всех t ∈[t T0, ], где

. (2)

Условия (1) и (2) не позволяют однозначно определить программную стратегию управления, претендующую на решение задачи 2, поскольку они содержат n неизвестных параметров, образующих вектор начальных условий

x

. Для их определения выведем так называемые условия трансверсальности на левом конце траектории.

Пусть

S0 ={xRn

ϕi ( )x ≤ 0, i =1, ,m},

где ϕi : Rn R1, i =1, ,m -заданные непрерывно дифференцируемые по совокупности аргументов функции. Дополнительно предположим, что для множества

S0 выполнено следующее условие регулярности: для всех xS0 набор векторов

∂ϕi ( )x 0

, iI ( )x ={i∈{1, ,m}
ϕi ( )x = 0}

x

является линейно независимым.

Оптимальное начальное положение фазового вектора x00 удовлетворяет равенству

T T

Φ

x T = Φ⎜⎜ X T t, x + X T,τ τ τ τB U d + X T[ ,τ τ τ]C( )d ⎟⎟ =

t0 t0

T T

= minx0∈S0 Φ⎜⎜ X [T t, 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU 0 ( )d + ∫ X T[ ,τ τ τ]C( )d ⎟.

t0 t0

⎧µ0

⎪ ⎪

⎪µ1

По теореме Кароша – Джона [22] существует вектор ⎬ ≠ 0, для которого