概述
动态规划处理的对象是多阶段策略问题。
多阶段策略问题,是指这样的一类特殊的活动过程,问题可以分解成若干相互联系的阶段,在每一个阶段都要做出决策,形成一个决策序列,该决策序列也称为一个策略。对于每一个决策序列,可以在满足问题的约束条件下用一个数值函数衡量该策略的优劣。多阶段策略问题的最优化目标是获取导致问题最优值的最优决策序列即得到最优解。
应用动态规划设计使多阶段决策过程达到最优(成本最省、效益最高、路径最短),依据动态规划的最优性原理: 作为整个过程的最优策略具有这样的性质,无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。也就是说,最优决策序列中的任何子序列都是最优的。