Название: Верификационные методы анализа оптимального управления процессами и системами(Попов П.М., Попов С.П.)

Жанр: Авиационные технологии и управление

Просмотров: 1006


1.5. анализ оптимального управления в системах методом динамического программирования

 

Суть метода можно пояснить на примере задачи синтеза оптимального управления объектом (разработан Р. Беллманом для решения задач оптимального управления) с ограниченными координатами, которое должно переводить его изображающую точку из заданного состояния у(о) в некоторую область (g) фазового пространства за определенное Т, минимизируя функционал

 

 

(1.37)

Условия,         которым         должны          удовлетворять            фазовые          координаты    объекта           и управляющие воздействия на него, в векторной форме могут быть записаны

 

(1.38)

 

где G - область фазового пространства, из которой не должна выходить экс-

 

М - замкнутое ограниченное множество функций, из которого выбираются кусочно-

непрерывные управления u(t}',

 

Если за начало отсчета взять не t=0, а некоторую другую точку t1 интер-

вала [0;T], а в качестве начальных условий выбрать новую точку y(t1) из области G и найти

оптимальное управление, минимизирующее функционал

 

(1.39)

 

то  значение минимума функционала  (1.39)  будет  отличаться от  минимума функционала

(1.37) при условиях (1.38). Следовательно, минимум функциона-

 

ла есть функция от начального момента времени t1 и начальной точки которую принято обозначать             Если функция определена при t=0,

 

есть минимум функционала (1.37).

 

В основе метода динамического программирования лежит принцип  оптимальности,

сформулированный для широкого круга систем. Обозначив че-

 

рез       оптимальную траекторию в фазовом пространстве, на которой реализуется минимум функционала (1.37) при условиях (1.38), а через

- точку, соответствующую новому началу отсчета t1 и расположен

 

ную на оптимальной траектории    можно записать такую формулиров-

 

 

Можно дать и другую формулировку принципа оптимальности: оптимальная стратегия не зависит от «предыстории» системы и определяется лишь ее состоянием в рассматриваемый момент времени.

 

Если известна функция         где t - произвольная точка на интервале

 

- произвольная точка из области G, то с помощью условий (1.38) не трудно найти оптимальное управление. Однако сложно определить             в

аналитической форме, поэтому чаще всего эту функцию определяют прибли-

 

женно. Основой приближенного метода определения    служат следую-

 

щие положения. Выражение для     можно записать так

 

(1.40)

 

(1.41а) (1.416)

(1.41в)

 

В силу принципа оптимальности поведение u(t) на интервале [t1+Аt,T]

 

не влияет на величину первого интеграла в выражении (1.40), поэтому u(t) на

 

этом интервале выбирается так, чтобы минимизировать второй интеграл. Тогда выражение

(1.40) можно записать в виде

 

(1.42)

 

 

Зависимости  (1.47)  и  (1.48)  после  подстановки  в  них  результатов,  полученных  на первом шаге, позволяют определить функцию

 

В дальнейшем процедура повторяется, и для вычислений могут быть использованы рекуррентные формулы

 

где k - номер шага.

 

 

Вычисления продолжаются до тех пор, пока не будет получена функция

 

 

вать как минимум критерия качества, так и устойчивость замкнутых систем.

4.         Метод  позволяет  получать  простые  для  понимания,  хорошо  осмысливаемые

физически алгоритмы решения задач оптимального управления на ПЭВМ (ЭВМ).

Таким образом, рассмотренные выше методы анализа оптимального управления и принятия управленческих решений, применительно к процессам и системам автоматического управления, иллюстрируют достоинства и перспективность их использования в сочетании с вычислительными комплексами и ПЭВМ, использование методов синтеза различных типов оптимальных систем и т.д.