Планируется деятельность 2 отраслей на n лет. Начальные ресурсы S
Средства X, вложенные в 1 отрасль дают в конце года прибыль =f (x) и возвращаются в размере q (x), аналогично для 2 отрасли. В конце года все возвращенные средства заново перераспределяются между отраслями, новые средства не поступают, прибыль в производство не вкладывается.
Требуется распределить имеющиеся средства на n лет т.о., чтобы прибыль от обеих отраслей была бы max.
Имеем: номер шага - номер года, управляемая система- 2 отрасли, управление состоит в выделении средств каждой отрасли в очередном году. Параметры состояния к началу к-го года - s - количество средств подлежащих распределению. Переменных управления на каждом шаге 2 : x - количество средств1 отрасли, y - 2 отрасли. Но т.к все средства распределяются, то y = s - x и поэтому управление на к- шаге зависит от 1 переменной X (x , s - x ).
Уравнения состояния s = q (x )+ q ( s - x ) выражают остаток средств, возвращенных в конце к-года. Показатель эффективности к- шага – прибыль, полученная в конце года от 2 отраслей: f (x )+f ( s - x ). Суммарный показатель эффективности –прибыль за n лет-
Z = f (x )+f ( s - x ).
Пусть Z (S ) – условная оптимальная прибыль за n-k+1 лет. Тогда оптимальная прибыль за n лет = Z = Z (S )/
Уравнения Беллмана имеют вид:
Z (S ) = max{ f (X ) + f (S - X )}
Z (S ) = max { f (X ) + f (S - X ) + Z (S )}
Методы принятия решений при известном априорном распределении вероятности на множестве состояний среды.