Будем считать, что объект управления описывается системой дифференциальных уравнений:
(1)
Здесь:
X – n-мерный вектор состояния ОУ;
U – m-мерный вектор управляющих функций;
A – матрица размера (матрица динамики ОУ);
B – матрица (матрица коэффициентов передачи).
Управление динамическим объектом (1) должно быть таким, чтобы минимизировать критерий качества ОУ в функционал:
(2)
Здесь и не отрицательно определенные симметричные матрицы размера , которые удовлетворяют условиям:
Эти два неравенства должны выполняться для любого n-мерного вектора.
Далее, - положительно определенная матрица , то есть это симметричная матрица, которая удовлетворяет условию:
для любого m-мерного вектора .
Мы считаем, что - начальное значение и - конечное значение вектора состояния ОУ.
Вводим в рассмотрение вспомогательный функционал:
(3)
Теперь вводится в рассмотрение вспомогательная скалярная функция:
(4)
Вводим вспомогательную функцию, которая имеет название – гамильтониан. В этом случае функционал запишется:
(5)
Теперь рассмотрим интеграл: .
Берем интеграл по частям:
Теперь функционал (5) запишется в виде:
(6)
Теперь рассмотрим вариацию этого функционала, которая вызвана вариацией управляющей функции и вектора . При этом считаем, что если начальное значение времени фиксировано, то фиксировано также и конечное значение времени .
Выражение для вариации функционала:
(7)
Выберем вектортаким образом, чтобы коэффициенты при вариациях и были равны нулю. Тогда получаем уравнение для определения :
(8)
Граничные условия для системы уравнений (8):
(9)
Так как:
(10)
тогда в этом случае вариация функционала запишется:
(11)
Сделаем следующее замечание: вспомогательный функционал совпадает с исходным функционалом на решениях системы уравнений (1). Поэтому, если достигает минимума, то минимума достигает и функционал . Если достигает минимума, то его вариация должна быть равна нулю.
То есть должно выполняться условие:
(12)
Приведем сведения из линейной алгебры, которые мы будем использовать в дальнейшем:
На основании этих формул получаем следующее:
Чтобы найти вектор управляющих функций, которые доставляют экстремум функционалу (2) или критерию качества, нужно решить систему дифференциальных уравнений:
(13)
(14)
где управляющая функция определена из условия:
Транспонированный вектор управляющей функции определяется равенством:
Или:
(15)
Здесь следует отметить, что граничные условия для уравнений (13) и (14) разделены. Одно из них задано на левом конце траектории , другое задано на правом конце .
Теперь, с учетом этого, запишем следующие дифференциальные уравнения, которые определяют оптимальное управление: