Динамическое программирование. Принцип оптимальности и уравнение Беллмана. Общая схема применения метода ДП. Задача об оптимальном распределении ресурсов между отраслями на n лет.
Динамическое программирование – метод оптимизации, приспособленный к операциям, в которых процесс принятия решений может быть разбит на шаги.
Такими методами решаются в основном задачи управления запасами, складирования, распределения ресурсов, управления основными фондами.
Основное достоинство этих методов если др. методы чувствительны к выбору функций Z, то динамические методы к этому не особо чувствительны. Они хорошо работают при табличном задании функции.
Общая постановка задачи
Рассматривается управляемый процесс (замена оборуд., пополнение запасов).
Существует некая эк.система с начальным состоянием s (либо фиксировано либо мн-во состояний со случайной реализацией какого-либо)
В результате управления система S переходит из начального состояния s в .
Предположим, что управление можно разбить на n шагов.
Обозначим через X управление на к-шаге.
Пусть X (X ,…….X ) управление, переводящее систему S из состояния s в . Обозначим через s состояние системы после к-го шага. Получаем последовательность состояний s ,…. s ….s =S^.
Xk= Xk(x1,x2,…, xn)-случай задачи многомерной по управлению
Sk= Sk(s1,s2,…, sn)- случай задачи многомерной по состоянию
Пространство, в котором координаты являются координатами состояния называется базовым пространством.
Показатель эффективности рассматриваемой управляемой операции – целевая функция - зависит от начального состояния и управления: Z=F(s ,X).
Основное достоинство этих методов если др. методы чувствительны к выбору функций Z, то динамические методы к этому не особо чувствительны. Они хорошо работают при табличном задании функции.