Python强化学习:算法、核心技术与行业应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一部分 强化学习基础

本部分涵盖强化学习的必要背景,包括定义、数学基础以及强化学习解决方案方法论的概述,为你的后续学习奠定基础。

本部分包含以下章节:

❑ 第1章 强化学习简介

❑ 第2章 多臂老虎机

❑ 第3章 上下文多臂老虎机

❑ 第4章 马尔可夫决策过程的制定

❑ 第5章 求解强化学习问题