Методы принятия управленческих решений: для менеджеров

134 Пусть G j , G \ 2 T - соответственно области оп ределения (допустимых решений) для задачи на последнем этапе, на последних двух этапах и т.д., G область определения исходной задачи. Пусть Z-j(xj_\) - условно оптимальное значение функции цели на последнем этапе, т.е. Z,l(jr7-_l)=max(niin)Z7-(x7-_j,U7-),V j ^ G j (71) Обозначим Z-2(^r-2)'^з(-*^7'-з)'••• соответственно оптимальные значения функции цели на двух последних, трех по следних этапах и т.д., на Тэтапах. В силу этих обозначений имеем: max(min) (Z7_i(;c7-_2 UT-2^Gt-\J ^ъ{хт-ъ)= max(min)(Z^,2(^7--3.W7--3)+^2(^7-2)) (73) и, зеСг.2, Г-I,Г Lk{xT-k)= max(min) (^r-zt+l ."r-t+l)+^yn(-*7--/t+l)) UT-k^Gf_k^\ T t, ...r (74) L t [ X q ) = max(mm) (Z,(^q ."I) + ^r-l (^1)) (75) H] ^Gf Выражения (71) - (75) называются функциональными урав нениями Беллмана. Эти уравнения имеют рекуррентный характер, так как для нахождения оптимального уравнения на Т шагах нужно знать условно оптимальное управление на последуюших Г-1 шагах и т.д. Поэтому функциональные уравнения также называют рекур рентными соотношениями Беллмана. Используя функциональные уравнения Беллмана, находим решение рассматриваемой задачи динамического программирова ния. Решение ишется в обратном порядке от XJ_^ до X q .