Смекни!
smekni.com

Оптимальные и адаптивные системы

- корнивещественные



Суммадвух экспонентпредставляетсобой:



Если

,то корникомплексно-сопряженныеи решение будетпредставлятьсобой периодическуюфункцию. В реальнойсистеме, переключенийне более 5 - 6.
  1. Методповерхностипереключений


Данныйметод позволяетнайти управлениефункций переменнойсостояния дляслучая когдаоптимальноеуправлениеносит релейныйхарактер


.

Такимобразом этотметод можноприменять прирешении задачоптимальногобыстродействия,для объектас аддитивнымуправлением


,

.

Сутьметода заключаетсяв том, чтобы вовсём пространствесостоянийвыделить точки,где происходитсмена знакауправленияи объединитьих в общуюповерхностьпереключений.


,

- поверхностьпереключений

.

Законуправлениябудет иметьследующий вид


.

Дляформированияповерхностипереключенийудобнее рассматриватьпереход изпроизвольнойначальной точкив начало координат


.

Есликонечная точкане совпадаетс началом координат,то необходимовыбрать новыепеременные,для которыхэто условиебудет справедливо.

Имеемобъект вида


.

Рассматриваемпереход

,с критериемоптимальности

.

Этоткритерий позволяетнайти законуправлениятакого вида


,

с неизвестным

,начальныеусловия
нам такженеизвестны.

Рассматриваемпереход:


Методобратноговремени

(методпопятногодвижения)


Этотметод позволяетопределитьповерхностипереключений.

Сутьметода заключаетсяв том, что начальнаяи конечнаяточки меняютсяместами, приэтом вместодвух совокупностейначальныхусловий остаётсяодна для

.

Каждаяиз этих траекторийбудет оптимальна.Сначала находимточки, где управлениеменяет знаки объединяемих в поверхность,а затем направлениедвижения меняемна противоположное.



Пример


Передаточнаяфункция объектаимеет вид


.

Критерийоптимальностибыстродействия



Ограничениена управление

.

Рассмотримпереход


.

1)

,

2)

.

3)


оптимальноеуправлениебудет иметьрелейный характер


.

4) Перейдёмв обратноевремя (т.е.

).В обратномвремени задачабудет иметьтакой вид

.

5) Рассмотримдва случая:


Получимуравнениязамкнутойсистемы

.

Воспользуемсяметодом непосредственногоинтегрирования,получим зависимость

от
и поскольку
-
,то имеем

,

т.к.начальные иконечные точкипоменяли местами,то

,
получим

, (*)

аналогично



подставив(*), получим

,

отсюда


.

Построимполучившеесяи по методуфазовой плоскостиопределимнаправление





Применивметод непосредственногоинтегрирования,получим:


,

,

.

Функциябудет иметьвид:


Изменивнаправление

точка сменызнака

(точка переключения)

Общееаналитическоевыражение:

.

Уравнениеповерхности:


.

Оптимальныйзакон управления:


,

подставивуравнениеповерхности,получим:


.

2.5.Субоптимальныесистемы


Субоптимальныесистемы - этосистемы близкиепо свойствамк оптимальным



-характеризуетсякритериемоптимальности.


- абсолютнаяпогрешность.

-относительнаяпогрешность.

Субоптимальнымназывают процессблизкий коптимальномус заданнойточностью.

Субоптимальнаясистема - системагде есть хотьодин субоптимальныйпроцесс.


Субоптимальныесистемы получаютсяв следующихслучаях:


  1. приаппроксимацииповерхностипереключений(с помощьюкусочно-линейнойаппроксимации,аппроксимацияс помощью сплайнов);



    при

    в субоптимальнойсистеме будетвозникатьоптимальныйпроцесс.


  2. ограничениерабочей областипространствасостояний;





3.АДАПТИВНЫЕСИСТЕМЫ


3.1.Основныепонятия


Адаптивнымисистемаминазывают такиесистемы, в которыхпараметрырегулятораменяются вследза изменениемпараметровобъекта, такимобразом, чтобыповедениесистемы в целомоставалосьнеизменными соответствоваложелаемому:


,

.

Существуетдва направленияв теории адаптивныхсистем:


  1. адаптивныесистемы с эталонноймоделью (АСЭМ);


  2. адаптивныесистемы сидентификатором(АСИ).


  1. Адаптивныесистемы сидентификатором


Идентификатор- устройствооценки параметровобъекта (оценкапарамет­ровдолжна осуществлятьсяв реальномвремени).



АР - адаптивныйрегулятор

ОУ - объектуправления

U- идентификатор


Часть,которая выделенапунктиром,может бытьреализованав цифровомвиде.


Рис1.Функциональнаясхема АСИ


V,U, X - могутбыть векторы.Объект можетбыть многоканальным.


Рассмотримработу системы.


В случаенеизменныхпараметровобъекта, структураи параметрыадаптивногорегуляторане меняются,действуетглавная обратнаясвязь, сис­темапредставляетсобой системустабилизации.

Еслипараметрыобъекта меняются,то они оцениваютсяидентификато­ромв реальномвремени и происходитизменениеструктуры ипараметровадаптивногорегуляторатак, чтобы поведениесистемы оставалосьнеизмен­ным.

Основныетребованияпредъявляютсяк идентификатору(быстродействиеи т.д.) и к самомуалгоритмуидентификации.

Такойкласс системиспользуютдля управленияобъектами смедленныминестационарностями.

Еслимы имеем нестационарныйобъект общеговида:


,

,
.

Простейшийадаптивныйвид будет следующий:


.

Требования,которые предъявляютсяк системе:


, (*)

,

где

и
-матрицы постоянныхкоэффициентов.

Реальномы имеем:


или

(**)

Еслиприравнять(*) и (**), то получимсоотношениедля определенияпараметроврегулятора


3.3.Адаптивныесистемы с эталонноймоделью


В такихсистемах существуетэталоннаямодель (ЭМ), котораяставится параллельнообъекту.



БА - блокадаптации.


Рис2.Функциональнаясхема АСЭМ


Рассмотримработу системы.


В томслучае, когдапараметрыобъекта неменяются илипроцессы навыходе соответствуютэталонным,ошибка

,не работаетблок адаптациии не перестраиваетсяадаптивныйрегулятор, всистеме действуетплавная обратнаясвязь.

Еслиповедениеотлично отэталонного,это происходитпри изменениипараметровобъекта, в этомслучае появляетсяошибка

,включаетсяблок адаптации,перестраиваетсяструктураадаптивногорегулятора,таким образомчтобы свестик эталонноймодели объекта.

Блокадаптациидолжен сводитьошибку к нулю(

).

Алгоритм,закладываемыйв блок адаптации,формируетсяразличнымиспособами,например, сиспользованиемвторого методаЛяпунова:


.

Еслиэто будетвыполняться,то системабудет асимптотическиустойчива и

.

1.Экстремальныесистемы управления


Введение

ЭкстремальныеСУ – это такиеСАУ, в которыходин из показателейкачества работынужно удерживатьна предельномуровне (minилиmax).

КлассическимпримеромэкстремальнойСУ являетсясистема автоподстройкичастоты радиоприёмника.

A




-экстремальнаяхарактеристика


w

Рис.1.1.Амплитудно-частотнаяхарактеристика


1.1.Постановказадачи синтезаэкстремальныхсистем


Объектыописываютсяуравнениями:

(1.1)

Экстремальнаяхарактеристикадрейфует вовремени.

Необходимоподобрать такоеуправляющеевоздействие,которое позволялобы автоматическинаходить экстремуми удерживатьсистему в этойточке.

U:extr Y=Yo(1.2)

Y


y– выходдинамическойчасти объекта

Y– экстремальныйвыход



Y

o-точкаэкстремума


yoy

Рис.1.2.Статическаяэкстремальнаяхарактеристика


Необходимоопределитьтакое управляющеевоздействие,которое обеспечиловыполнениесвойства:

(1.3)

1.2.Условие экстремума


Необходимоеусловие экстремума– равенствонулю первыхчастных производных.


G– градиент.(1.4)

Достаточноеусловие экстремума– равенствонулю вторыхчастных производных.

Присинтезе экстремальнойсистемы необходимооценить градиент,но вектор вторыхчастных производныхоценить невозможно,и на практике,вместо достаточногоусловия экстремумаиспользуютсоотношение:

-min(1.5)

-max(1.6)

Этапысинтеза экстремальнойсистемы:

  1. оценкаградиента.

  2. Организациядвижения всоответствиис условием: G0,т.е. движениек экстремуму.

  3. Стабилизациясистемы в точкеэкстремума


U

=f+BU yY

P y = g(x)

экстремальная

регулятор характеристика


БОГ


Рис.1.3.Функциональнаясхема экстремальнойсистемы


1.3.Виды экстремальныххарактеристик


1)Унимодальнаяэкстремальнаяхарактеристикатипа модуля


Y

Y = k |y|(1.7)

Y = k1|y-y0(t)|+ k2(t)

k1– определяетнаклон;

Yo yo– горизонтальныйдрейф экстремума;

k2– вертикальныйдрейф экстремума.


y0


Рис.1.4. Экстремальнаяхарактеристикатипа модуля


2)Экстремальнаяхарактеристикатипа параболы

Y

Y= ky2;(1.8)

Y= k1[y-yo(t)]2+ k2(t)


y


Рис.1.5. Экстремальнаяхарактеристикатипа параболы


3)В общемслучае экстремальнуюхарактеристикуможно описатьпараболой n-го порядка:

Y= k1|y-yo(t)|n+ k2|y-yo(t)|n-1+ …+kn|y-yo(t)|+ kn+1(t).(1.9)


4)Векторно-матричноепредставление

Y= yTBy(1.10)


1.4.Способыоценки градиента


1.4.1.Способ деленияпроизводных


Рассмотримего на унимодальнойхарактеристике,y-выход динамическийчасти системы.

y

R1,
Y= Y(y,t)

Найдёмполную производнуюпо времени:

(1.11)

Примедленномдрейфе

,таким образом
(1.12)

Достоинство:простота.

Недостаток:при малых

0нельзя определитьградиент.

-дифференцирующийфильтр.

yY

БОГ

G


Рис.1.6. Схема оценкичастной производной


1.4.2.Дискретнаяоценка градиента


(1.13)

y Y

Недостаток:невозможностьопределения

Gприy= 0.


y(kT) Z-1 Z-1 Y(kT)


G

Рис.1.7. Схема дискретнойоценки частнойпроизводной


1.4.3.Дискретнаяоценка знакаградиента


Прималом шагедискретизациизаменяем:Т 0:


(1.14)

1.4.4.Метод синхронногодетектирования


Методсинхронногодетектированияпредполагаетдобавлениеко входномусигналу наэкстремальныйобъект дополнительногосинусоидальногосигнала малойамплитуды,высокой частотыи выделениеиз выходногосигнала соответствующейсоставляющей.По соотношениюфаз этих двухсигналов можносделать выводо знаке частныхпроизводных.


yY

ГСК– генераторсинусоидальных

asinwtколебаний.

ФЧУФЧУ –фазо-чувствительноеустройство

ГСК Ф- фильтр

Ф


Z

Рис.1.8. Функциональнаясхема оценкичастной производной


Y

Yo


t

t


y

y1 yo y2

a


t t


Рис.1.9. Иллюстрацияпрохожденияпоисковыхколебаний навыход системы


y1– рабочаяточка

Приэтом разностьфаз сигналовравна 0.

y2–разностьфаз сигналовравна 

Вкачестве простейшегоФЧУ можноиспользоватьблок перемножения.


ФЧУ

y 1) 2)



1) Y2)



Рис.1.10. Иллюстрацияработы ФЧУ


В качествефильтра выбираютусредняющийна периодефильтр, которыйпозволяетполучить навыходе сигнал,пропорциональныйзначению частнойпроизводной.


Y

Прималой амплитудепоисковогосигнала можносчитать, чтостатическаяхарактеристикав малой окрестностирабочей точки– линейка иаппроксимируемеё касательнойв этой точке.


y1 y

Рис.1.11. Линеаризациястатическойхарактеристикив рабочей точке


Следовательноуравнениеэкстремальнойкривой можнозаменить уравнениемпрямой:

(1.16)


Сигнална выходе ФЧУ:

(1.17)

k– коэффициентпропорциональности– тангенс угланаклона прямой.

.(1.18)

Сигнална выходе фильтра:


Такимобразом:

(1.19)

Методсинхронногодетектированиягодится дляопределенияне только однойчастной производной,но и градиентав целом, приэтом на входподаётся несколькоколебанийразличнойчастоты. Соответствующиефильтры навыходе выделяютреакцию наконкретныйпоисковыйсигнал.


1.4.5.Специальныйфильтр оценкиградиента


Этот методпредполагаетвведение всистему специальнуюдинамическуюсистему, промежуточныйсигнал которойравен частнойпроизводной.


y


Z

ДФ Р


G


Рис.1.12. Схема специальногофильтра оценкичастной производной

T-постояннаявремени фильтра

;

;(1.20)

При

:
(1.21)

Дляоценки полнойпроизводнойY используютДФ – дифференцирующийфильтр, а затемэта оценкаполной производнойприменяетсядля оценкиградиента.


1.5.Организациядвижения кэкстремуму


1.5.1. Системыпервого порядка


(1.22)

Организуемзакон управленияпропорциональноградиенту:

(1.23)

Запишемуравнениезамкнутойсистемы:

- нелинейноедифференциальноеуравнение(1.24)

Этообычное дифференциальноеуравнение,которое можноисследоватьметодами ТАУ.

Рассмотримуравнениестатики системы:

т.к.
,то из уравненияследует, что

(1.25)

Еслис помощьюкоэффициентаусиления kобеспечитьустойчивостьзамкнутойсистемы, тоавтоматическив статике мыпридём в точкуэкстремума.В некоторыхслучаях с помощьюкоэффициентаk можно кромеустойчивостиобеспечитьопределённуюдлительностьпереходногопроцесса взамкнутойсистеме, т.е.обеспечитьзаданное времявыхода на экстремум.


Пример:

;
;

;
гдеk – устойчивость>0

=1

U=-y


-

БОГ


G

Рис. 1.13. Функциональнаясхема градиентнойэкстремальнойсистемы первогопорядка

Этотспособ годитсятолько дляунимодальныхсистем, т.е. системс одним глобальнымэкстремумом.

1.5.2. Методтяжёлого шарика


Поаналогии сшариком, которыйскатываетсяв овраг и проскакиваетточки локальныхэкстремумов,система АУ сколебательнымипроцессамитакже проскакиваетлокальныеэкстремумы.Для обеспеченияколебательныхпроцессов всистему первогопорядка вводимдополнительнуюинерционность.


-

БОГT-?

G

Рис. 1.14.Иллюстрацияметода “тяжёлого”шарика


G =y;

-уравнениезамкнутойсистемы;

- характеристическоеуравнениесистемы.(1.26)

d

Чемменьше d темдлиннее переходныйпроцесс.

Анализируяэкстремальнуюхарактеристику,задаются необходимыеперерегулированиеи длительностьпереходногопроцесса, откудазадаются:



1.5.3. Одноканальныесистемы общеговида


(1.28)

Законуправления:

Подставивзакон управленияв управлениеобъекта, получимуравнениезамкнутойсистемы:


(1.29)

В общемслучае, дляанализа устойчивостизамкнутойсистемы необходимоиспользоватьвторой методЛяпунова, спомощью которогоопределяетсякоэффициентусиления регулятора.Т.к. 2й методЛяпунова даётлишь достаточноеусловие устойчивости,то выбраннаяфункция Ляпуноваможет оказатьсянеудачной ирегулярнуюпроцедурурасчёта регулятораздесь предложитьнельзя.


1.5.4. Системысо старшейпроизводнойв управлении


Общий случайэкстремумаобъектов

(1.30)

Функцииf, B и gдолжны удовлетворятьусловиямсуществованияи единственностирешения дифференциальногоуравнения.Функция g– должна бытьмногократнодифференцируемой.

С – матрицапроизводных

;

Задачасинтеза разрешима,если матрицапроизведений

будет не вырожденна,т.е.

(1.31)

Анализусловия разрешимостизадачи синтезапозволяетопределитьпроизводнуювыходных переменных,которая явнозависит отуправляющеговоздействия.Если выполняетсяусловие (1.31), тотакой производнойявляется перваяпроизводная

,а следовательнотребованияк поведениюзамкнутойсистемы можноформироватьв виде дифференциальногоуравнения дляy, соответствующегопорядка.


Сформируемзакон управлениязамкнутойсистемы, длячего сформируемзакон управления,подставив вправую частьуправлениядля

:

-уравнениезамкнутойсистемы относительновыходной переменной.

(1.34)

Рассмотримситуацию, когда

(1.35)

Присоответствующемвыборе коэффициентаусиления мыполучаем желаемоеуравнение иавтоматическийвыход на экстремум.

Параметрырегуляторавыбираютсяиз тех соображений,что и для обычныхСАУ, т.е.

(СВК)i= (20100),что позволяетобеспечитьсоответствующуюошибку.


U yY

F k


БОГ

G


Рис. 1.15. Схемасистемы состаршей производнойв управлении


Всистеме дляоценки полнойпроизводнойпо времени всистему вводятдифференцирующийфильтр, поэтомудля оценкиградиентовв таких системахудобно использоватьфильтр оценкиградиента.

Т.к. обаэтих фильтраимеют малыепостоянныевремени, то всистеме могутвозникатьразнотемповыепроцессы, выделитькоторые можнос помощью методаразделениядвижений, причёммедленныедвижения будутописыватьсяуравнением(1.34), котороесоответствуетжелаемому при

.

Быстрыедвижения нужноанализироватьна устойчивость,причём в зависимостиот соотношения постояннойвремени ДФ ифильтра оценкичастных производных(ФОЧП), можновыделить следующиевиды движений:


1)Постоянныевремени этихфильтров соизмеримы

Быстрыедвижения описываюткомбинированныепроцессы в этихдвух фильтрах.

2)Постоянныевремени различаютсяна порядок

В системенаблюдаютсякроме медленныхдвижений, быстрыеи сверх- быстрыедвижения,соответствующиенаименьшейпостояннойвремени.

На устойчивостьнеобходимоанализироватьоба случая.


2.ОПТИМАЛЬНЫЕСИСТЕМЫ


2.1.Введение


Оптимальныесистемы –это системы,в которых заданноекачество работыдостигаетсяза счет максимальногоиспользованиявозможностейобъекта, инымисловами этосистемы, в которыхобъект работаетна пределесвоих возможностей.


Рассмотримапериодическоезвено первогопорядка


K

W(p) = ——― , (2.1)

Tp+1


u≤A, (2.2)


длякоторого необходимообеспечитьминимальноевремя переходау из начальногосостояния y(0)в конечное yk.Переходнаяфункция такойсистемы приK=1 выглядитследующимобразом



Рис.2.1. Переходнаяфункция системыпри U= const.


Рассмотримситуацию, когдана вход объектаподаем максимальновозможноеуправляющеевоздействие.



Рис.2.2. Переходнаяфункция системыпри U=A= const.


t1 -минимальновозможное времяперехода y изнулевого состоянияв конечное дляданного объекта.


Дляполучениятакого переходасуществуетдва законауправления:


  • программноеуправление


A, t 1

y= (2.3)

yk, t ≥ t1;


  • законуправлениятипа обратнойсвязи


A, y k

y= (2.4)

yk, y ≥ yk;


Второйзакон болеепредпочтителени позволяетобеспечитьуправлениепри помехах.



Рис.2.3. Структурнаясхема системыс законом управлениятипа обратнойсвязи.


2.2. Постановказадачи синтезаоптимальныхсистем.

2.2.1. Математическаямодель объекта.

Объектописан переменнымисостояния

xRn, uRm, m ≤ n,(2.5)

гдефункция f(x,u)непрерывна,дифференцируемапо всем аргументами удовлетворяетусловию существованияи единственностирешения дифференциальногоуравнения. Этафункция являетсянелинейной,но стационарной.

В качествечастных случаевобъект можетиметь вид нелинейнойсистемы с аддитивнымуправлением

(2.6)

либолинейной системой

(2.7)

Объектдолжен бытьпредставленв одной из трехформ, представленныхвыше.


2.2.2. Множествоначальных иконечных состояний.

Задачаоптимальногоперехода изначальногосостояния вконечное представляетсобой краевуюзадачу, гденачальные иконечные точкимогут бытьзаданы однимиз четырехспособов,представленныхна рис. 2.4.



Рис.2.4. Фазовыепортреты переходасистемы изначальногосостояния вконечное дляразличныхзадач:

а) задача сфиксированнымиконцами,

б)задача с фиксированнымпервым концом(фиксированнаяначальная точкаи множествоконечных значений),

в) задача сфиксированнымправым концом,

г) задача сподвижнымиконцами.


Дляобъекта множествоначальныхсостояний может в общем случаесовпадать со всем множествомсостояний либос рабочей областью,а множествоконечных состоянийявляетсяподпространством множествасостояний илирабочей области.


Пример 2.1.


Влюбую ли точкупространствасостояний можноперевестиобъект, описываемый системой уравнений?

-x10– x20+ 2u = 0;



Запишемуравнениястатики дляданного объекта

2x10– x20+ u = 0;


Подставивво второе уравнениезначение U изпервого уравненияu =x20– 2x10,получим

-5x10+ x20= 0;


Получилимножествоконечных состояний,описываемоеуравнением


x20= 5x10;


Такимобразом, множествоконечных состояний,задаваемоедля объекта(системы), должнобыть реализуемым.


2.2.3. Ограниченияна состоянияи управление



Рис.2.5. Общий видрабочей областипространствасостояний.


Выделяетсярабочая областьпространствасостояний,которая оговаривается.Как правило,эта областьописываетсяее границамис помощью модульныхсоглашений.




Рис.2.6.Вид рабочейобласти пространствасостояний,

заданноймодульнымисоглашениями.


Такжезадается U– область допустимыхзначений управляющеговоздействия.На практикеобласть Uзадается такжес помощью модульныхсоотношений.


Ui≤Ū­i,

Задачасинтеза оптимальногорегуляторарешается приусловии ограниченийна управлениеи ограниченномресурсе.


2.2.4. Критерийоптимальности.

На этомэтапе оговариваютсятребования,предъявляемыек качествуработы замкнутойсистемы. Требованиязадаются вобобщенномвиде, а именнов виде интегральногофункционала,который носитназвание критерияоптимальности.

Общийвид критерияоптимальности:

,(2.8)

Частныевиды критерияоптимальности:


1) критерийоптимальности,обеспечивающийминимум временипереходногопроцесса (решаетсязадача оптимальногобыстродействия)

;(2.9)

2) критерийоптимальности,обеспечивающийминимум затратэнергии:


  • поодной из компонент

;(2.10)
  • по всемпеременнымсостояниям

;(2.11)
  • поодному управляющемувоздействию

;(2.12)
  • по всемуправляющимвоздействиям

;(2.13)
  • по всемкомпонентам(в самом общемслучае)

. (2.14)
2.2.5. Формарезультата

Необходимооговорить вкаком видебудем искатьуправляющеевоздействие.

Возможныдва вариантаоптимальногоуправленияU0:

  • u0= u0(t)– используетсяпри отсутствиивозмущения,

  • u0= u0(x)– оптимальноеуправлениев виде обратнойсвязи (замкнутоеуправление).


Формулировказадачи синтезаоптимальнойсистемы в общемвиде:

Для объекта,описанногопеременнымисостояниямис заданнымиограничениямии множествомначальных иконечных состояний,необходимонайти управляющеевоздействие,обеспечивающеекачество процессовв замкнутойсистеме, соответствующеекритериюоптимальности.


2.3. Методдинамическогопрограммирования
2.3.1. Принципоптимальности

Исходныеданные:

, xRn, uRm, m ≤ n,

ui≤Ū­i, x(0), x(T) ,

Необходимонайти u0



Рис.2.7. Фазовый портретперехода системыиз начальнойточки в конечную

впространствесостояний


Траекторияперехода изначальной точкив конечнуюбудет оптимальнойи единственной.


Формулировкапринципа:

Конечныйучасток оптимальнойтраекторииесть такжеоптимальнаятраектория.


Еслибы переход изпромежуточнойточки в конечнуюне осуществлялсябы по оптимальнойтраектории,то для негоможно было бынайти своюоптимальнуютраекторию.Но в этом случаепереход изначальной точкив конечнуюпроходил быпо другой траектории,которая должнабыла бы бытьоптимальной,а это невозможно,так как оптимальнаятраекторияединственная.


2.3.2. ОсновноеуравнениеБеллмана.

Рассмотримобъект управленияпроизвольноговида

, xRn, uRm, m ≤ n,

Необходимообеспечитьпереход изначальной точкив конечную скритериемоптимальности


.(2.16)

Рассмотримпереход впространствесостояний




Рис.2.8. Фазовый портретперехода системыиз начальнойточки в конечную

x(t)– текущая (начальная)точка, x(t+Δt)– промежуточнаяточка.


В
ыберемпромежуточнуюточку и рассмотримпоэтапныйпереход


(2.17)


Преобразуемвыражение

(2.18)

Заменимвторой интегрална V(x(t+Δt))

(2.19)

Прималом значенииΔt βведем допущения:

1)

(2.20)

2) Разложимвспомогательнуюфункцию

, (2.21)

(2.22)

Выполняядальнейшиепреобразования,получим

, (2.23)

гдеmin V(x(t)) иесть критерийоптимальностиJ

В результатеполучили

. (2.24)

Разделимобе части выраженияна Δtи устраним Δtк нулю.

, (2.25)

где

Получимосновное уравнениеБеллмана

(2.26)
2.2.3. Расчетныесоотношенияметода динамическогопрограммирования

ОсновноеуравнениеБелмана содержит(m+1) - неизвестныхвеличин, т.к.U0Rm, VR1


(2.27)

Продифференцировавm раз,получим системуиз (m+1)уравнений.

Дляограниченногокруга объектоврешение полученнойсистемы уравненийдает точноеоптимальноеуправление.Такая задачаносит названиезадачи АКОР(аналитическогоконструированияоптимальныхрегуляторов).

Объекты,для которыхрассматриваетсязадача АКОР,должны удовлетворятьследующимтребованиям:


1)

  1. T,

  2. Критерийоптимальностидолжен бытьквадратичным

.

Пример2.2

Для объекта,описываемогоуравнением

,

необходимообеспечитьпереход из x(0)в x(T) покритериюоптимальности

,


U1=5x,

U2=-6x


Проанализировавобъект наустойчивость,получимU0= U2 =-6x.


2.4. ПринципмаксимумаПонтрягина

(2.28)

или

(2.29)


Введемрасширенныйвектор состояний,который расширяемза счет нулевойкомпоненты,в качествекоторой выбираемкритерийоптимальности.zRn+1


. (2.30)

Такжевведем расширенныйвектор правыхчастей, которыйрасширяем засчет функции,стоящей подинтеграломв критерииоптимальности.

(2.31)

ВведемΨ – векторсопряженныхкоординат

(2.32)

СформируемГамильтониан,представляющийсобой скалярноепроизведениеΨ иφ(z,u)

H(Ψ,z,u)= Ψ•φ(z,u), (2.33)


(2.34)

Уравнение(2.34) называетсяосновнымуравнениемпринципа максимумаПонтрягина,основанноена уравнении динамическогопрограммирования

Оптимальнымявляется управление,которое назаданном интервалевремени доставляетмаксимумГамильтониана.Если бы ресурсуправленияне был бы ограничен,то для определенияоптимальногоуправленияможно было бывоспользоватьсянеобходимымии достаточнымиусловиямиэкстремума.В реальнойситуации дляотысканияоптимальногоуправлениянеобходимоанализироватьвеличинуГамильтонианапри предельномзначении уровня.В этом случаеU0 будетфункцией расширенноговектора состоянийи вектора сопряженныхкоординат

u0= u0(z,Ψ)

Для отысканиясопряженныхкоординатнеобходиморешить системууравнений

.
2.4.1. Процедурарасчета системыпо принципумаксимумаПонтрягина.

  1. Уравненияобъекта должныбыть приведенык виду, стандартномудля синтезаоптимальныхсистем.

, xRn, uRm, m≤n

Необходимооговорить такженачальные иконечные состоянияи записатькритерийоптимальности

.(2.35)
  1. Вводятсярасширенныйвектор состояний

, (2.36)

расширенныйвектор правыхчастей

(2.37)

ивектор сопряженныхкоординат

. (2.38)
  1. ЗаписываемГамильтонианкак скалярноепроизведение

H(Ψ,z,u)= Ψ•φ(z,u), (2.39)


  1. НаходиммаксимумГамильтонианапо u

, (2.40)

покоторому определяемоптимальноеуправление u0(Ψ,z).


  1. Записываемдифференциальныеуравнения длявектора сопряженныхкоординат

. (2.41)

Находимсопряженныекоординатыкак функциювремени

Ψ=Ψ(t). (2.42)


6.Определяемокончательныйоптимальныйзакон управления

u0=u0(t). (2.43)

Какправило, этотспособ позволяетполучить программныйзакон управления.


Пример2.3.

Дляобъекта, представленногона рис. 2. 9. необходимообеспечитьпереход изначальной точкиy(t) в конечнуюy(t) за T=1c с качеством процесса

U y

Рис.2.9. Модель объекта


  1. W


    (p)=y/U= 1/p2

x1(0)=0x1(T)=1

x2(0)=0x2(T)=0



,
,
.

3.

H(Ψ,Z,U)= Ψ0u21x2+ Ψ3u.



,

u0=- Ψ2/2Ψ0.


5.


6.

Дляопределенияконстант b1и b2нужно решитькраевую задачу.


З


апишемуравнениезамкнутойсистемы

П


роинтегрируем

Рассмотримконечную точку t=T=1с.


x1(T)=1

x2(T)=0


1= 1/6 b1+ 1/2 b2

0=1/2b1+ b2


Получилисистему уравнений,из которойнаходим b2= 6, b1= -12.

Запишемзакон управленияu0=-12t + 6.


2.4.2. Задачаоптимальногоуправления

, xRn, uRm, m≤n

Дляобъекта общеговида необходимообеспечитьпереход изначальной точкив конечную заминимальноевремя приограниченномзаконе управления.

. (2.44)

Особенностизадачи оптимальногобыстродействия


  1. Гамильтонианбыстродействия.

H = Ψ▪φ= Ψ0▪1+ Ψ1▪f1(x,u)+…+ Ψn▪fn(x,u), (2.45)

Ψ0=-1. (2.46)

H = -1+ Ψ1▪f1(x,u)+…+ Ψn▪fn(x,u), (2.47)

Hб= Ψ1▪f1(x,u)+…+ Ψn▪fn(x,u)=

▪f(x,u) (2.48)

=[Ψ1,…,Ψn] (2.49)

. (2.50)
  1. Релейностьуправления.

Этаособенностьимеет местодля релейныхобъектов.

,xRn, uRm, m≤n,

Hб=

▪(Ax+Bu);

  1. Теоремао числе переключенийуправляющеговоздействия.

Этатеорема справедливадля линейныхмоделей свещественнымикорнями характеристическогоуравнения.


det(pI-A)=0 (2.51)

Λ(A)– векторвещественныхсобственныхчисел.


Формулировкатеоремы:

Взадаче оптимальногобыстродействияс вещественнымикорнями характеристическогоуравнения числопереключенийне может бытьбольше, чем(n-1),где n– порядокобъекта, следовательно,число интерваловпостоянствауправленияне будет больше,чем (n-1).




Рис. 2.10. Видуправляющеговоздействияпри n=3.


Пример2.4

.

Рассмотримпример решениязадачи оптимальногобыстродействия:


,
, T0=1

,


.
  1. Ψ=[Ψ12].


  1. Hб1x22(-2dx2 –x1+u).




,

,

.