Смекни!
smekni.com

Принцип Максимума Понтрягина (стр. 1 из 4)

Постановка задачи оптимального управления.

Состояние объекта управления характеризуется n -мерной вектор функцией, например, функцией времени

Так, шестимерная вектор-функция времени полностью определяет положение самолета как твердого тела в пространстве. Три координаты определяют положение центра масс, а три - вращение вокруг центра масс.

От управляющего органа к объекту управления поступает вектор-функция

. Векторы x' и u' , обычно связаны между собой каким-то соотношением. Наиболее развитым в настоящее время является уравнение, в котором векторы связаны системой обыкновенных дифференциальных уравнений.

И так, пусть движение управляемого объекта описывается системой дифференциальных уравнений

(1.1)

где

- вектор координат объекта или фазовых координат,
- заданная вектор-функция,
- вектор управлений или просто управление.

В уравнении (1.1) векторы

являются функциями переменной t, обозначающей время, причем
, где
- отрезок времени, на котором происходит управление системой.
На управление обычно накладывается условие

,
(1.2)

где U(t) - заданное множество в

при каждом
.
Будем называть далее управлением кусочно-непрерывную на отрезке
(т. е. имеющую конечное число разрывов первого рода) r--мерную вектор-функцию и, непрерывную справа в точках разрыва и непрерывную в точке Т. Управление и называется допустимым, если оно удовлетворяет ограничению (1.2).
Заметим, что ограничиться рассмотрением непрерывных управлений оказывается невозможным, так как с их помощью трудно моделировать моменты переключения управления такие, как, например, включение и отключение двигателей, отделение ступеней ракеты, поворот рулей и т. д.
Иногда рассматривают и более широкие классы допустимых управлений, например, класс всех ограниченных измеримых управлений, удовлетворяющих условию (1.2).
Покажем, как при произвольном начальном положении
и допустимом управлении и определяется траектория управляемого объекта. Рассмотрим задачу Коши

(1.3)

Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо, поясним, что понимается в данном случае под решением задачи (1.3). Для этого поступим следующим образом.

Пусть функция и имеет скачки в точках

причем
. Предположим, что задача (1.3) имеет решение х, определенное на всем отрезке [to,
], причем
. Далее рассмотрим задачу Коши

.

Предполагая, что она имеет решение на отрезке [

] и
,приходим к задаче

и т. д.

Если функцию х удалось определить указанным способом на всем отрезке [to. Т], то будем называть ее решением задачи (1.3) или фазовой траекторией (иногда просто траекторией), соответствующей управлению и. Отметим, что x - непрерывная по построению функция, удовлетворяющая на отрезке

равенству

При выполнении определенных условий на f решение задачи (1.3), соответствующее управлению и, существует и единственно при произвольном начальном положении

и произвольном допустимом управлении и.

Помимо ограничения на управление могут существовать ограничения и на фазовые координаты

(1.4)

Ограничения на концах траектории целесообразно рассматривать отдельно:

(1.5)


здесь

, S (Т) - заданные множества из R";
-заданные множества из R, причем inf
< sup
, to<.T.

Таким образом, начальный и конечный моменты времени не обязательно фиксированы. Случаю фиксированных to, Т соответствуют множества

,
, состоящие из одной точки; при этом говорят, что рассматривается задача с закрепленным временем.

Если So (to) = {

} при любом
,то левый конец траектории называют закрепленным. Если же So (to) == R" при всех
, то левый конец траектории называют свободным. Во всех остальных случаях левый конец называют подвижным. В аналогичных ситуациях говорят о закрепленном, свободном или подвижном правом конце траектории.

Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов.

Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)].

Наиболее часто под задачами управления понимаются задачи, в которых роль функционала выполняет интегральный функционал

Мы будем рассматривать задачу с целевым функционалом

(1.6)

представляющим собой сумму интегрального функционала

и терминального

функционала Ф(х(Т), Т). Эта задача называется задачей Больца. Ее частными случаями являются задача с интегральным функционалом, называемая задачей Лагранжа, и задача с терминальным функционалом, называемая задачей Майера. Задача с интегральным функционалом при

называется задачей оптимального быстродействия.

Набор (to, Т, х

, и, х), минимизирующий функционал (1.6), называется решением задачи оптимального управления, управление и - оптимальным управлением, а траектория х - оптимальной траекторией. Часто решением задачи оптимального управления называют пару (ц, х).

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше