核心概念
- 阶段$k$
- 状态变量$x_k$(状态集合)
- 决策变量$u_k$(决策集合$D_k(x_k)$,状态转移方程$x_{k+1}=T(x_k,u_k)$可以看成是理所应当的,是$u_k$作为决策变量的必要条件)
- 最优指标函数$f_k(x_k)$(指标函数$V_{k,n}$:当前状态变量、现阶段子策略(=决策变量+下阶段最优子策略) 的函数;阶段指标$v_k(x_k,u_k)$;策略$p_{k,n}$=决策序列;后部子过程)
动态规划的核心
看待某类问题的角度——状态的定义以及转移方程的定义:
- 拆成若干个阶段/步骤
- 每个阶段定义一个状态变量(或者直接定义最优指标函数)
- (定义角色变量并进一步)得到状态转移方程(或者直接得到最优指标函数转移方程)