前言
人工智能技术广泛出现在各个应用场景中,包括人脸识别、语音识别、机器对话、推荐系统等方面,其背后离不开数据的增加和算力的增强。统计学习和深度学习作为人工智能技术的两大核心也日益受到人们的关注,虽然目前现阶段的人工智能和真正的“智能”无法相提并论,但理解和掌握统计学习和深度学习知识会让我们更加接近“通用智能”的理想。
关于人工智能的书籍浩如烟海,大部分人已经对于大部头的书籍望而生畏,但又希望获得体系化的知识,而本书有两个重要的特点:
1.更强调对理论的深入理解。针对性地选择了20个主题,希望可以解决很多人面临的困境——不满足于知识堆砌,想达到体系化的理解。例如对于大多数书直接引入的sigmoid和softmax函数,本书会介绍其背后隐藏的广义线性模型;还比如大多数书直接引入的正则化作为过拟合的常用手段,本书会介绍其与极大后验估计的关系……
2.用代码实践结合理论讲解。采用了算法理论和代码实践相结合的方式,在这里代码实践提供了算法实现的某一种或者某几种方式,其目的主要是用来更好地理解算法。在这里,算法和代码的关系,更像是理论与实验的关系,我们用实验来帮助大家更好地理解理论。
本书包含深度学习的知识,分为10章。第1章节介绍深度学习的简洁发展思路和表示学习机制;第2章、第3章介绍神经网络的基于梯度的优化方法、神经网络的优化难点以及相应的解决办法;第4章讨论神经网络也会遇到的过拟合问题;第5章分析神经网络的最小组成部分——神经元;第6章讨论三种方案解决深层网络的训练难题:批标准化、SELU、ResNet;第7章、第8章讲述两种重要的神经网络模型,即卷积神经网络和循环神经网络;第9章讨论对于神经网络的无监督学习方式;第10章详细讨论以变分自编码器和对抗生成网络为代表的概率生成网络。
人工智能的发展太过迅速,本书只是广阔无边大海里的一艘小小船。学问广袤无际,做学问更要勤勉躬亲,作者深知诠才末学,书中难免有不足之处,希望大家指正和交流,感激不尽。
编者
2021年5月