157 使用奖励策略