本部分涵盖强化学习的必要背景,包括定义、数学基础以及强化学习解决方案方法论的概述,为你的后续学习奠定基础。
本部分包含以下章节:
❑ 第1章 强化学习简介
❑ 第2章 多臂老虎机
❑ 第3章 上下文多臂老虎机
❑ 第4章 马尔可夫决策过程的制定
❑ 第5章 求解强化学习问题