Принцип максимума определяет необходимые условия оптимальности управления в нелинейных управляющих системах. Он распространен и на случаи, когда на координаты состояния системы накладываются ограничения. Рассмотрим основную теорему принципа максимума и дадим более удобную формулировку оптимального управления.
Пусть оптимальное управление описывается системой нелинейных дифференциальных уравнений:
(1)
или в векторной форме:
Здесь:
- -мерный вектор состояния объекта
- -мерный вектор управляющих воздействий
- функция правой части уравнения (1)
Полагаем, что вектор управления принимает значения из некоторой замкнутой области U r-мерного пространства управлений. Положим, что функции непрерывны по всем аргументам и имеют непрерывные производны по переменным состояния . Назовем допустимыми управлениями те управления , которые являются кусочно-непрерывными функциями времени и принимают значения из множества U.
Основная задача оптимального управления формулируется следующим образом: среди всех допустимых управления, приводящих изображающую точку в фазовом пространстве X из начального положения в конечное , если эти управления существуют. И нужно найти такие управления, для которых функционал:
(2)
достигает минимума.
Введем новую переменную , которая определяется следующим дифференциальным уравнениям:
(3)
Здесь - подынтегральная функция функционала (2).
Присоединив уравнение (3) к системе уравнений (1), получим:
(4)
Запишем (4) в векторной форме. Для этого введем в рассмотрение (n+1)-ый вектор координат состояния: , тогда в векторной форме записи это уравнение запишется следующим образом:
(5)
Здесь:
вектор правых частей системы (5).
Заметим, что вектор-функция не зависит от координаты вектора . Обозначим через точку с координатами в (n+1)-ом фазовом пространстве . Пусть - некоторое допустимое управления, для которого соответствующая фазовая траектория (1) проходит при через точку . А при выполнении равенства через точку .
Из уравнения (2) следует, что координата определяется равенством:
Если , то будем иметь:
Таким образом, в пространстве фазовая траектория системы (5), соответствующая тому же управлению , проходит при через точку , а при через точку . Это иллюстрирует следующий рисунок:
Обозначим через П прямую в пространстве , проходящую через точку и параллельную оси . Тогда основную задачу оптимально управления можно сформулировать следующим образом:
В (n+1)-мерном пространстве заданы начальная точка и прямая П, параллельная оси и проходящую через точку . Среди всех допустимых управлений, обладающих тем свойством, что решение системы (5) с начальными условиями проходит через точку прямой П, необходимо выбрать такое управления, для которого координата точки имело бы минимальное значение.
Сформулированная задача представляет собой задачу Майера на условный экстремум. Однако в силу ограничений, накладываемых на допустимое управление методами классического вариационного исчисления, эта задача не решается.
Введем в рассмотрение вспомогательные переменные , которые удовлетворяют следующей системе уравнений:
(6)
Система (6) называется сопряженной по отношению к системе уравнений (5). Если выбрать некоторое допустимое управление на отрезке и найти соответствующее ему решение с заданными начальными условиями , то при подстановки в систему уравнений (6) управления и решения , получим линейную однородную систему уравнений:
(7)
Система (7) удовлетворяет условиям существования и единственности решения системы дифференциальных уравнений. Системы уравнений (5) и (6) можно объединить одной формой записи, для этого надо ввести в рассмотрение функцию H:
(8)
Здесь:
Тогда системы (5) и (6) запишутся следующим образом:
(9)
(10)
Отметим, что вектор функций и непрерывны всюду, кроме точек разрыва допустимого управления . Эти вектор-функции имеют непрерывные производные. При фиксированных значениях и функция H становится функцией только управления .