6.2.2 强化学习在机器人方面的应用