5.1.2 基于离散动作空间算法的模型实现