4.有趣的奖励函数让机器人更快速地掌握专业技能