深度学习在动态媒体中的应用与实践
上QQ阅读APP看书,第一时间看更新

前言

深度学习在被《MIT技术评论》评选为2013年世界十大突破性技术之首后,保持着迅猛发展的趋势,现已应用在人脸识别、自然语言处理、图像审核、车型识别、图像搜索等前沿技术中。作为目前热门的技术,很多计算机从业者、科研爱好者都对深度学习充满了好奇,但是由于深度学习涉及很多高深的数学原理,所以对于初学者而言,深度学习的入门门槛较高,急需一本以项目实战为主的书指引初学者登入深度学习的殿堂。市场中现有的关于深度学习的书籍大多偏重理论、公式的推导,缺乏实战的讲解,对读者从“入门到放弃”有很大的影响。本书注重实战项目的讲解,让读者从实战快速入门深度学习。

本书只涉及深度学习的基本原理,不过多纠结数学公式推导,能让读者快速上手书中的实战项目,用于实际生产。本书非常适合以下读者:对深度学习有浓厚兴趣的读者、希望通过深度学习完成设计的计算机专业或电子信息专业的高校毕业生、想从实战项目入手的深度学习研发工程师或算法工程师。

第一部分是概要,由两章构成。第1章主要从深度学习的发展、深度学习的应用、主流的几款深度学习框架的对比这3个方面,对深度学习进行了介绍。第2章主要从深度学习的基本概念、训练过程以及模型3个部分来阐述深度学习的基本理论。

第二部分是深度学习三大主流框架以及各个框架下的生产实例的详细介绍。第3章介绍了3种主流框架,分别是Caffe、TensorFlow、Torch,主要以Ubuntu系统为主,介绍了三大框架的安装过程,并记录了一些安装过程中的常见问题和解决方法,在每一个深度学习框架的最后,都利用该框架解决了一个实际生产问题。第4、5、6章分别是这3个框架应用于人脸识别、车辆识别、不良视频识别的生产实例,首先对项目进行了概述和需求分析,然后设计了项目系统,对功能和模块进行了描述,紧接着在Ubuntu系统上部署了生产环境,并对生产环境进行了验证,最后通过脚本实现了生产流程。

第三部分是集群部署和运营维护,也即第7章。首先阐述了由于深度学习框架部署的复杂性,引出了Docker容器,介绍了Docker的主要构成组件及其优点,然后以TensorFlow为例,详细介绍了基于Docker的TensorFlow实验环境搭建步骤。最后简单介绍了运营维护需要注意的要点。

中国电信股份有限公司广州研究院的农德华也参与了各章节的编写工作,卢琳完成了漫画配图的创作工作,在此对他们的辛勤付出表示衷心的感谢!此外,由于作者经验有限,书中难免有不妥之处,敬请读者批评指正。

编者

2018年1月于广州