前言
为何撰写本书
笔者从事机器学习教育行业已有四年,其间也在“IT邦帮忙”撰写过上百篇文章(https://ithelp.ithome.com.tw/users/20001976/articles),从学员及读者的回馈中获得了许多宝贵意见,期望能将整个历程集结成册,同时,相关领域的发展也在飞速变化,过往的文章内容需要翻新,因此笔者借机再重整思路,思考如何能将算法的原理解释得更简易清晰,协助读者跨入AI的门坎,另外,也尽量避免流于空谈,增加应用范例,希望能使学生实现即学即用,不要有过多理论的探讨。
AI是一个将数据转化为知识的过程,算法就是过程中的生产设备,最后产出物是模型,再将模型植入各种硬件装置,如计算机、手机、智能音箱、汽车、医疗诊断仪器等,这些装置就拥有了特殊专长的智能,再进一步整合各项技术就可以构建出智能制造、智能金融、智能交通、智慧医疗、智能城市、智能家庭等应用系统。AI的应用领域如此广阔,个人精力和能力有限,唯有从基础扎根,再扩及有兴趣的领域,因此,笔者撰写这本书的初衷,就是希望读者在扎根的过程中,贡献一点微薄的力量。
本书主要的特点
(1)笔者身为统计人,希望能以统计/数学为出发点,介绍深度学习必备的数理基础,但又不希望内文有太多数学公式的推导,让离开校园已久的在职者看到大量数学符号心生恐惧,因此,本书尝试以程序设计取代定理证明,缩短学习历程,增进学习乐趣。
(2)TensorFlow 2.X版有巨大的变动,默认模式改为Eager Execution,并以Keras为主力,整合TensorFlow其他模块,形成完整的架构,本书期望对TensorFlow架构作完整性的介绍,并非只是介绍Keras而已。
(3)算法介绍以理解为主,辅以大量图表说明,摒弃长篇大论。
(4)完整的范例程序及各种算法的延伸应用,以实用为要,希望能触发读者灵感,能在项目或产品内应用。
(5)介绍日益普及的算法与相关套件的使用,如YOLO(目标检测)、GAN(生成对抗网络)/DeepFake(深度伪造)、OCR(光学文字辨识)、人脸识别、BERT/Transformer、ChatBot、强化学习、语音识别(ASR)等。
目标对象
(1)深度学习的入门者:必须熟悉Python程序语言及机器学习的基本概念。
(2)数据工程师:以应用系统开发为职业志向,希望能应用各种算法,进行实际操作。
(3)信息工作者:希望能扩展深度学习知识领域。
(4)从事其他领域的工作:希望能一窥深度学习奥秘者。
阅读重点
(1)第1章介绍AI的发展趋势,鉴古知今,引导读者了解前两波AI失败的原因,比较第三波发展的差异性。
(2)第2章介绍深度学习必备的统计/数学基础,读者不仅要理解相关知识,也要力求能撰写程序解题。
(3)第3章介绍TensorFlow的基本功能,包括张量(Tensor)运算、自动微分及神经网络模型的组成,并说明梯度下降法求解的过程。
(4)第4章开始实作,依照机器学习十项流程,撰写完整的范例,包括Web、桌面程序等。
(5)第5章介绍TensorFlow进阶功能,包括各种工具,如TensorBoard、TensorFlow Serving、Callbacks等。
(6)第6~10章介绍图像/视频的算法及各式应用。
(7)第11~14章介绍自然语言处理、语音及各式应用。
(8)第15章介绍AlphaGo的基础——强化学习算法。
本书范例程序代码和参考文献全部可以通过扫描二维码获取。
致谢
原本笔者计划整理过往文章集结成书,但由于相关技术发展太快,几乎全部重新撰写编排,因此耗时较长,因个人能力有限,还是有许多问题成为遗珠之憾,仍待后续努力,编写过程中感谢栾大成、申美莹在编辑、校正、封面构想环节的尽心协助,也感谢清华大学出版社的大力支持,使本书得以顺利出版,最后要借此书,纪念一位挚爱的亲人。
书中内容如有疏漏、谬误之处或有其他建议,欢迎广大读者来信指教。
陈昭明
2022-08
参考文献.docx
教学课件.pptx