Оптимальные линейные дискретные регуляторы

Рассмотрим систему (7.1)

x(i + 1) = A(i) x(i) + B(i) u(i) (7.19)

и на её примере покажем наиболее простой способ определения оптимального в некотором смысле управления. Смысл оптимальности обычно определяется критерием или “закладывается” в него.

Будем управлять состояниями и введем критерий

x^T(i+1) V₁(i+1) x(i+1) + u^T(i) V₂(i) u(i) ® min (7.20)

В критерии - два слагаемых, являющихся квадратичными формами. Будем считать, что состоянием является отклонение соответствующих величин от заданных значений. Тогда первое слагаемое в (7.20) представляет собой квадратичную форму от этих отклонений. Матрица V₁ задает приоритеты отклонениям состояний, ранжирует их по важности. Для наглядности предположим, что весовая матрица V₁ диагональная. Тогда первое слагаемое в (20) в развернутом виде выглядит так:

x^T(i+1) V₁(i+1) x(i+1) = V_{1 kk}(i+1)x²_k (i+1)

и представляет сумму квадратов ошибок состояний.

Второе слагаемое в (7.20) по структуре полностью совпадает с первым, но представляет квадратичную форму от управлений и является нежестким ограничением на их величину.

Если мы будем варьировать значения матрицы V₁по отношению к V₂, то мы можем переносить ограничения с u на x.

Заметим, что в (7.20) не входит начальное состояние, которое задано, т.к. на него мы не можем воздействовать, и не входит управление в последний момент времени, т.к. оно влияет на состояния в момент времени после рассматриваемого.

Задача оптимального управления состоит в том, что нужно найти последовательность управляющих воздействий u(i₀+1), u(i₀+2)…, которая обеспечивает выполнение (7.20).

Можно было бы эту задачу попытаться решить “в лоб”, т.е. выписать выражения для всех х от х(i₀) до конечного x(N). Из xR, u RN*r решений – размерность слишком велика. Целесообразным будет попытаться свести эту N*r – мерную задачу к N задачам r – й размерности.

Для устранения этой проблемы используется принцип оптимальности Беллмана.

Теорема. При любом начальном состоянии и оптимальном начальном управлении последующее управление должно быть оптимальным относительно состояния, возникшего в результате начального управления.

Доказательство производится от противного. Рассмотрим на некотором интервале времени t₁£ t £ t₂ систему S с вектором управления u и вектором состояния x . Время может быть дискретное или непрерывное, концы могут быть свободными или закреплёнными. Пусть Q некоторый критерий качества, который оптимизируется на заданном интервале [t₁, t₂], например, минимизируется.

Допустим, что существует, по крайней мере, одно управление u(t), удовлетворяющее всем ограничениям и минимизирующее Q на [t₁, t₂], обозначим это оптимальное управление u⁰(t), а соответствующее ему значение критерия Q⁰.

Рассмотрим некоторый момент времени t’ Î[t₁,t₂] и предположим, что на интервале [t’,t₂] существует управление u*(t), для которого значение критерия Q меньше, чем для u⁰(t) на этом же интервале и при том же начальном состоянии. Поэтому комбинированное управление

обеспечивает значение критерия Q**< Q⁰ на интервале [t₁,t₂]. Но по условию u⁰(t) является оптимальным управлением, которое не может быть улучшено. Следовательно, имеем противоречие, которое и доказывает теорему.

Принцип оптимальности позволяет сформулированную выше задачу определения вектора управлений размером N*r – мерную задачу разделить на N r-мерных задач. При использовании принципа оптимальности решение осуществляется в обратном порядке, т.е. сначала определяется управление u(N-1), переводящее систему в конечное состояние x(N) из состояния x(N-1). При этом в соответствии с принципом оптимальности принимается, что управление u(N-1) должно быть оптимально относительно состояния x(N-1). Так что последнее управление будет в соответствии с принципом оптимальности оптимальным. Затем определяется управление u(N-2) и т.д. до u (0).

Рассмотрим решение одношаговой задачи определения u(N-1).

Обозначим Q₁=[x^T(N)V₁(N)x(N) + u^T(N-1)V₂(N-1)u(N-1)] (7.22)

В соответствии с (7.19) имеем

x(N) = A(N-1)x(N-1) + B(N-1)u(N-1)

Подставим этот результат в (7.22) и получим

Q₁ = {[ A(N-1)x(N-1) + B(N-1)u(N-1)]^T V₁(N) [A(N-1)x(N-1) +

+ B(N-1)u(N-1)] + u^T (N-1)V₂(N-1)u(N-1)} =

={x^T(N-1)A^T(N-1)V₁(N)A(N-1)x(N-1)+x^T(N-1)A^T(N-1)V₁(N)B(N-1)u(N-1) + u^T(N-1)B^T(N-1)V₁(N)A(N-1)x(N-1) + u^T(N-1)[B^T(N-1)V₁(N)B(N-1) +

+ V₂(N-1)]u(N-1)}.

Второе слагаемое в скобке равно транспонированному третьему, а т.к. они скаляры, то они равны, и можно записать

Q₁ ={x^TA^TV₁Ax + 2x^TA^TV₁Bu + u^T[B^TV₁B + V₂]u} (7.23)

Чтобы найти минимум необходимо приравнять нулю градиент Q₁ по управлению:

= 2x^TA^TV₁B + 2u^T[B^TV₁B + V₂] = 0.

Решая это уравнение относительно неизвестного управления, получим

u(N-1)=-{B^T(N-1)V₁(N)B(N-1) + V₂(N-1)}^-1B^T(N-1)V₁(N)A(N-1)x(N-1) (7.24)

Это линейный оптимальный закон управления, его физическая реализуемость обеспечивается соответствующим выбором матрицы V₂.

Обозначим матрицу обратной связи, определяющую регулятор S(N-1)

S(N-1)=-{B^T(N-1)V₁(N)B(N-1) + V₂(N-1)}^-1B^T(N-1)V₁(N)A(N-1) (7.25)

тогда закон управления записывается в виде

u(N-1) = S(N-1)x(N-1) (7.26)

Матрица S(N-1) называется матрицей обратной связи системы управления.

Далее можно подставить найденное управление в критерий и найти его значение. Затем решается двухшаговая задача. Положив

Q₂={[x^T(N-1)V₁(N-1)x(N-1)+u^T(N-2)V₂(N-2)u(N-2)] +

+ [x^T(N)V₁(N)x(N) + u^T(N-1)V₂(N-1)u(N-1)]}, т.к. выбор u(N-1) не влияет на x(N-1) , а x(N) уже определено и минимальное значение критерия Q₁ уже найдено, то для минимизации Q₂ достаточно решить задачу

Q₂ = {[x^T(N-1)V₁(N-1)x(N-1)+u^T(N-2)V₂(N-2)u(N-2)] +Q₁} (7.27)

Из (7.27) видно, что для определения u(N-2) нужно решить такую же задачу, которая была рассмотрена для u(N-1), т.к. (7.27) ничем не отличается от (7.23).

Дальше процедура определения управлений на всех шагах до u(0) абсолютно одинакова.

Кроме того, можно получить, что управления на каждом следующем шаге и значения критерия оптимальности выражаются с помощью рекуррентных формул через предыдущие, что делает процедуру определения оптимального линейного регулятора для многошагового процесса достаточно простой при цифровой реализации.