前言
几年前,我受北京大学光华管理学院领导的委托,负责筹划学院的商业分析专业硕士项目。为此,我请团队成员帮忙从互联网上爬取了几十万份与数据分析相关的招聘简章,并对其中需要的专业技能做了粗糙分析,然后将这些技能需求与现有的各个高等院校相关专业的教学大纲做了简单对比。我们从中很容易可以看到,商业分析专业的教学课程设置存在较大问题。例如,关于人工智能相关课程设置的问题:一方面,市场对该领域人才具有巨大需求;另一方面,由于院校师资力量匮乏导致课程开设困难。而课程开设困难的另一个重要原因就是缺少相关教材,尤其是缺乏简单易懂、容易上手的教材。
如果想要使该项目能为同学们提供一流的、前瞻性的教育,该专业就必须开设与人工智能相关的课程。从技术实施角度看,与人工智能相关的课程至少有两个:一个是机器学习,另一个是深度学习。开设与机器学习相关的课程相对容易,因为这个学科历史悠久,理论丰富、完备,师资储备也相对充足。但是,开设与深度学习相关的课程就比较困难:一是国内相关领域的学者较少,各个大学的师资储备较为薄弱;二是这些领域的学者和教师大都集中在计算机学院、大数据学院、数学学院、统计学院等理工科学院,这些学院的学生群体都具有理工科背景,教师即使使用相对传统的教学方法也能达到良好的教学效果。然而,商业分析专业硕士项目面对的学生群体较为复杂,他们中的一部分人具有理工科背景,而另一部分人具有偏文科背景(如管理学、经济学、文学等),这些具有文科背景的同学也是商业分析专业硕士项目非常重要的学生群体,他们有着独特的跨领域优势。如果这部分学生群体也能快速上手深度学习,入门人工智能这一关键技术,我相信他们肯定会为相关的应用领域带来丰富多彩的可能性,这也是多学科交融的魅力所在!但是,要学习深度学习就必须要用GPU,而调用GPU必须通过TensorFlow或者PyTorch完成。并且,任何一个编程框架都最好要有一定的Python基础。为了解决这个问题,北京大学光华管理学院的商业分析专业硕士项目为同学们准备了有关Python的前期课程,使Python基础学习不再是难事。除了商业分析专业硕士外,光华管理学院中还有很多MBA同学也想学习深度学习,他们中的大多数人没有任何Python基础,但也想通过学习这门课程,结合自己的工作经历思考如何在各种合适的商业场景下开拓人工智能应用的新领域。如何照顾这部分同学的需求,让他们也能享受深度学习的快乐,是值得我深思熟虑的问题。
基于以上原因,我下决心不仅要教这门课,还要写一本大家都能看懂、都能上手的关于深度学习的教材。但是,到底怎么学,怎么开发课程,怎么编写教材,我一开始真是一筹莫展。后来,在日本麻将平台上用深度学习算法打麻将的陈昱、北大信息科学学院的孙本元、中国人民大学统计学院的朱映秋等团队伙伴的帮助下,我终于收集到开发此课程所需的所有案例,并使案例中的所有代码都可以在Jupyter Notebook中实现。另外,我还对每一段代码做了详细的语音讲解,并将其一并加载在Jupyter Notebook里。之后,我将音频和PPT进一步整合,制作成教学视频,这些教学视频已被狗熊会的慕课平台收录。
通过开发以上提到的案例,我们团队里有20多人都可以上手深度学习了,大家都能写基于Keras的代码了,这给了我很大的信心,并尝试在2019年开课。第一次开课是给我们的MBA项目授课,面对专业背景不同的40多名同学,整个学习过程很辛苦,但同学们确实学到了很多东西,收获满满!可是,还有一个最大遗憾就是没有教材!很幸运的是,这时一直对深度学习具有极大兴趣的周静老师,愿意将我录制的音频转化成规范的文字,并在此基础上丰富理论基础,最后整理成适合作为教材的内容。
本书是整个团队集体努力的结果,有来自北京大学、中国人民大学、中央财经大学等多个院校的老师、同学付出的心血。没有一个强大的团队支撑,我是无法完成这个艰巨任务的。本书的写作逻辑与一般的深度学习教材不同。首先强调一点,深度学习仍然是一个关于x和y的回归分析问题。但是,它独特的地方在于,这里的x常常是高度非结构化的数据(如图像、文本)。在这个框架结构下,我们尝试去建立深度学习与普通回归分析的亲密联系,希望由此降低同学们学习的难度。从这里出发,同学们可以学习TensorFlow、Keras,学习如何在它们的帮助下完成线性回归、逻辑回归;接着,再学习卷积神经网络、各种关键技术和各种有趣的应用。通过以上的学习方式,我们尝试在降低学习难度的同时,提高同学们的学习效果。
本书的完成要特别感谢周静老师,感谢她的接力支持。参与本书编写的成员还有(按姓名拼音顺序):常象宇、陈昱、黄丹阳、刘进、鲁伟、马莹莹、潘文耕、潘蕊、任图南、孙本元、王菲菲、许可、朱雪宁、朱映秋。此外,还要感谢在书稿整理过程中付出辛苦劳动的高天辰、漆岱峰、向悦、谢贝妮等同学。最后,我想把这本书献给狗熊会的研究团队,是你们强有力的支持,我才完成了一个又一个看似不可能的任务;是你们的支持,我才具备了让数据科学教学变得更加有趣的能力。