Оптимальное управление линейными динамическими объектами (стр. 9 из 49)

Пример 9*. Рассмотрим линейный управляемый динамический объект

⎛⎜⎜⎜⎜⎜⎜⎜⎜xxx123⎟⎟⎟⎟⎟⎟⎟⎟⎠⎞=⎜⎜⎜⎜⎜⎜⎜⎜⎛⎝112

⎝ для которого

4 1 −4

₁¹¹⎞⎛⎠⎝⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜^x_xx123⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜¹₀0

0 1 0

100⎞⎛⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜uuu123⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟, ⎠⎝

⎛1 4 1⎞

⎛1 0 0⎞

⎛ ⎞0

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

⎜⎜⎜⎝2 −4 1⎠^⎟⎟ ⎝⎜⎜⎜0 0 1⎠⎟⎟ ⎝ ⎠⎜⎜⎜0⎟⎟

Полагаем

⎧⎪

θ0 = ={^t₀} {⁰}^,θ1 = ={^T} {¹}^,,S0 = ={x0} ⎪⎩⎪⎪⎨⎪⎪⎪⎪⎝ ⎠⎜⎜⎜⎜⎜⎜⎛ ⎞⎜111⎟⎟⎟⎟⎟⎟⎟⎟⎪⎭⎪⎬⎪⎪⎪⎪⎪⎫⎪∈ R3, S1 ={xT ∈ Rn

≤ 50},

^TI ⎡_⎣u()⋅ ,x()⋅ ⎤_⎦=_∫t u t( ),x t( ) dt + x t( )0 ²+ x T( ) ²,

⎛

P ={u ∈ R3 u ≤ 2}, u tˆ( )=⎜⎜⎜⎜⎜⎜cossint tt⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟, t ∈[0,1].

⎜⎝

Реализуем описанную выше схему оценки качества управления динамическим объектом для рассматриваемого случая. В примере 5 для однородной системы дифференциальных уравнений

⎛⎜⎜⎜⎜⎜xx123⎞⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜112 −144 111⎞⎛⎠⎝⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜xxx123⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎝⎜x ⎠

была построена фундаментальная матрица Коши

X t[ ,τ]= ⎛_⎜⎜⎜_⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜_{⎜⎜⎜⎜⎜⎜}⎜⎜⎜^⎜⎜⎜⎜⎜⎜⎜⎝−−54⁵2 e_e7¹5₅3₃(₍_sinsint_t−₋τ_τ)₎((₂−+_tt_sin−−⁵21₅ττ_coscos()_t)−((_ttτ−−) ^ττ₎)₋− ⎜	52 e3(t−τ) − 52 cos(t −τ)+ + ¹⁴₅sin(t −τ) 15 e3(t−τ) + 54 cos(t −τ)+ + 5²sin(t −τ) −4sin(t −τ)	− sin(t −τ) e ⁽^−τ⁾− cos(t −τ)+ + sin(t −τ) cos(t −τ)+sin(t −τ) 10353 e1015433(tt−τ) − 10533cos(t −τ)− ⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎟⎟⎟⎟⎟. ⎟
Для управления uˆ(⋅) по формуле (5.1) находим x tˆ( ) = x t t x u( , ₀, ₀, ˆ(⋅)) =

⎛⎞

⎜_⎟⎛ ⎞1

⎜ ⎜ ⎝

2sint

−4sint

^⎟⎜ ⎟1 cost +sint ⎟⎝ ⎠ ⎠

⎜ 2 −2cos −sin 2 + 4cos + 2sin 3 −3cos +sin ^{⎟⎜ ⎟}⎜ ⎟1 +

⎛ 54 e3(t−τ) + 15 cos(t −τ)− ⎜

⎜− ⁷₅sin(t −τ)

⎜

⎜ 2 e3(t−τ) − 2 cos(t −τ)− t ⎜ 5 5

+∫⎜− ¹₅sin(t −τ)

0 ⎜

⎜

^⎜⎜ 2sin(t −τ)

⎜

⎝

52 e3(t−τ) − 52 cos(t −τ)+ + ¹⁴₅sin(t −τ)

15 e3(t−τ) + 54 cos(t −τ)+

+ ₅²sin(t −τ)

−4sin(t −τ)

3 e3(t−τ) − 3 cos(t −τ)− ⎞

5 5

⎟

− ₅⁴sin(t −τ) ⎟

⎟

103 e3(t−τ) − 103 cos(t −τ)+⎟⎟ ⎛ sinτ⎞

+ 101 sin(t −τ) ⎟ ⎜⎜cosτ⎟⎟ dτ= .

⎟⎟ ⎜⎝ τ ⎟⎠ cos(t −τ)+sin(t −τ⁾^⎟_⎟

⎟

⎟ ⎟ ⎠

⎛ 30¹⎡⎣−20+62e^3t+3(− +4 5t)cost +9 1( +5t)sint⎦⎤⎞⎟ ⎜

= ⎜ ⎡⎣−10+31e +3 3+5t cost +12sint⎦⎤ ⎟⎟, t∈[0,1]

⎜

⎜ 1+ −t t cost −(1+ 2t)sint ⎟

⎝ ⎠

Далее полагаем

⎛ 41.4121 ⎞ x^ˆ( )1 = ^⎜_⎜21.1906 ^⎟_⎟, xˆ(1) = 46.531...< 50.

^⎜⎝−1.06472^⎟_⎠

Последнее неравенство означает, что для движения xˆ(⋅) выполнены граничные условия на правом конце. Величина критерия качества процесса вычисляется по формуле

I u⎣⎡ ˆ()⋅ , xˆ()⋅ ⎦⎤ =∫0 u tˆ( ), x t dtˆ( ) + xˆ( )0 ²+ xˆ( )1 ²= 49.7931.

1.7. Программные стратегии. Различают два типа стратегий управления динамическим объектом: позиционный и программный. Первый из них предполагает, что при назначении вектора управляющих параметров используется информация о текущем времени и о значении фазового вектора объекта; второй - только информация о текущем времени. В математическом плане программные стратегии можно отождествить с функциями одного переменного (текущего времени), а позиционные стратегии с функциями n+1 переменного, где n - размерность фазового вектора. Таким образом, множество программных стратегий формально включено в множество позиционных стратегий. Вместе с тем задача программного управления представляет и самостоятельный интерес. Это объясняется тем, что в ряде случаев результат управления, достигаемый в классе позиционных стратегий, может быть получен и в классе программных стратегий. В то же время техническая реализация программного управления значительно проще позиционного. Кроме того, решение задачи программного управления может быть использовано как вспомогательное средство решения задачи позиционного управления. Сами позиционные стратегии обычно применяются в тех случаях, когда дифференциальные уравнения движения объекта с недостаточной степенью точности описывают динамику управляемого процесса.

Другой сферой применения позиционных стратегий являются конфликтноуправляемые динамические объекты, математическими моделями которых служат дифференциальные игры. Позиционные стратегии управления не являются предметом изучения данного пособия.

Пусть P ⊂ R^r - область изменения вектора управляющих параметров.

Определение 8. Программной стратегией управления динамическим объектом на промежутке времени [t T₀, ]⊂ R¹ называется функция вида

U :[t T₀, ]→ P ⊂ R^r.

Обычно оговаривается класс допустимых программных стратегий. В частности, если им является класс кусочно-непрерывных (в точках разрыва непрерывных справа) функций, то допустимые программные управления можно отождествить с допустимыми реализациями вектора управляющих параметров. В этом случае программные стратегии будем также называть программными управлениями и обозначать строчными буквами.

В теоретических исследованиях программные стратегии обычно принадлежат более широким, классам функций, таким, как например, пространство L t T^r_p[ 0, ], p ∈[1,∞]. Здесь символом L^r_p[t T₀, ], p ∈[1,∞) обозначено пространство измеримых вектор функций u t T:[ 0, ]→ P⊂ R^r, для которых функция u()⋅ ^p суммируема на промежутке [t T₀, ] в смысле Лебега, с нормой