Название: Верификационные методы анализа оптимального управления процессами и системами(Попов П.М., Попов С.П.)

Жанр: Авиационные технологии и управление

Просмотров: 1006


1.3. анализ оптимального управления по принципу  максимума

 

При использовании принципа максимума движение объекта управления (системы управления) обычно представляется в виде системы обыкновенных дифференциальных уравнений

(1.22)

 

Допустимыми считаются управления и1,и2,...иm, которые являются  непрерывными для всех рассматриваемых t, за исключением конечного числа моментов, где они могут претерпевать разрывы первого рода. На участках непрерывности и в точках разрыва управления они могут принимать лишь конечные значения. Кроме того, на каждое из управлений могут накладываться дополнительные ограничения вида

 

Задача оптимального управления сводится к отысканию таких управлений, удовлетворяющих наложенным ограничениям, которые одновременно с переводом объекта (системы) из одного положения в другое обеспечивают экстремум выбранного функционала качества. При этом задача может решаться применительно к автономным и неавтономным системам  управления. Рассмотрим  задачу  оптимального  управления автономной системой, для чего сначала сформулируем определение этой системы. Итак, система называется автономной, если правые части дифференциальных уравнений, описывающих ее движение, явно не зависят от времени.

Функционал качества в этом случае выбирается в виде интегрального выражения

 

(1.23)

 

- заданная функция.

Задача оптимального управления по существу сводится к минимизации дополнительной координаты

 

 

удовлетворяющей  условию y0=0 при t=10.  В соответствии с выражением (1.23) к

системе (1.22) добавляется еще одно уравнение

 

(1.24)

 

Далее помимо основной системы уравнений (1.22) и (1.24)

 

рассматривается система сопряженных уравнений для вспомогательных переменных:

 

где

 

Введение функции Гамильтона

 

позволяет объединить основную и сопряженную системы уравнений одной записью

 

(1.26)

 

(1.27)

 

Для дальнейшего анализа оптимального управления по принципу максимума, рассмотрим его основную теорему, которая основывается на системе дифференциальных уравнений (1.22). Пусть u(t) является управлением,

приводящим изображаемую точку из начального положения y(tо) в конечное

V         V

положение у(Т) a y(t ) - соответствующая этому управлению траектория. Ес-

 

V         V

ли   u(t} оптимально, то найдется такая ненулевая вектор-функция ф(t), соот-

 

 

достигает

 
ветствующая u(t) и y(t ), при которой функция

времени,         находящийся в          заданном        интервале       (tоT),

максимального значения.

 

 

в любой момент

 

(1.28)

 

Выражение (1.28)  используется  для  определения функции  u(t).  Управление  будет оптимальным, если оно обеспечивает максимум функции

 

в любой момент времени.

 

Следует заметить, что при оптимальном управлении функции H(t} и

являются постоянными        Как видно из уравнений (1.28) принцип максимума устанавливает связь между управлением и координатами основной и сопряженной систем.

Выражения  (1.25)  и  (1.28)  позволяют  дать  геометрическое  пояснение  принципа максимума.

Величина Н является скалярным произведением векторов Ψ и у, поэтому направление движения изображающей точки при оптимальном управлении олжно быть таким, чтобы векторы Ψ , у являлись ортогональными. Следовательно, вектор обеспечивает направление движения изображающей точки в фазовом пространстве. Далее, анализируя систему дифференциальных уравнений (1.22), рассмотрим управление неавтономной системой  и в каком случае управление неавтономной системой может быть оптимальным.

Если в правую часть уравнений системы (1.22) явно входит время t, то задача оптимального управления состоит в переводе изображающей точки из начального положения у(tо) в положение, в котором выполнялись бы условия

 

где у1 (Т) - заданные функции времени.

Задача оптимального управления в этом случае может быть сведена к задаче с заданной точкой, если рассматривать движение системы в фазовом пространстве ошибки

 

где

 

Задача оптимального быстродействия является частным случаем задачи с закрепленными концами. Задача состоит в том, чтобы среди всех допустимых

 

 

V

управлений  определить  такие  u(t),  которые  переводят  изображаемую  точку  из  одного

положения в другое за минимальное время. За функционал качества принимается интегральное выражение вида

где T0 и Т - время начала и конца управления.

В   случае   оптимального   быстродействия   выражение   для   функции   Гамильтона

записывается в следующей форме

 

Поскольку во время управления ф0 = const. то достаточно рассмотреть

 

функцию

 

Таким  образом,  при   решении   задачи  оптимального   быстродействия  максимум функции Гамильтона будет иметь значение, большее или равное нулю

 

V

Как и прежде, вектор Ψ определяет направление вектора скорости. Однако в этом случае

векторы Ψ и и могут быть неортогональными.

V

При определении оптимального управления u(t) решаются совместно основная (1.26)

и сопряженная (1.27) системы уравнений. Для задач с закрепленными концами фазовых траекторий наряду с подбором управления u(t)максимизирующего функцию H1(y,ф,u) в каждой  точке  оптимальной  траектории,  необходимо  знать  начальное  состояние  объекта y1(to), y2(t0),..., уn(t0) и начальное значение вспомогательного вектора ф1(tо), ф2(ео),....,

Ψn(tо).   Вектор   y(to)  задается   условиями   задачи,   а   вектор   ф(tо)   заранее   неизвестен.

Составляющие вектора, Ψ 1(t0), где j= 1,2,...,и, необходимо подобрать таким образом, чтобы оптимальная траектория прошла через заданную концевую точку у1(T), у2(Т) ,..., уn(T).

Для      задач   с          подвижными             концами         граничные      положения     фазовой          точки

определяются из условий трансверсальности. Условия трансверсальности для левого и правого концов фазовой траектории определяются ортогональности

V         V

векторов Ψ (tо) и Ψ (Т) соответственно касательными векторов многообразий, связывающих

начальные и конечные значения фазовых координат

 

 

Условия трансверсальности дают дополнительные соотношения, необходимые для определения начальной и конечной точек фазовой траектории.

Из принципа максимума вытекают следующие основные положения теории оптимальных быстродействий:

1. Оптимальные системы управления являются системами релейного типа;

2. Число переключений оптимального управления конечно и не превышает (п - 1) переключений для систем, характеристические уравнения которых являются единственными отрицательными или нулевыми. В случае же комплексных корней характеристического уравнения число корней может быть больше, чем (п - 1). Вопросы построения оптимального уравнения в нелинейных системах и в системах с ограниченными фазовыми координатами подробно излагаются в работе «Теория оптимизации и расчет систем управления с обратной связью». Задача синтеза замкнутых оптимальных систем состоит в определении управления как функции фазовых координат