本书有什么内容
本书共分为18章,所有代码均采用Python语言编写,也是TensorFlow框架推荐使用语言。
第1章介绍深度学习的基本内容,初步介绍了其应用于计算机视觉和发展方向,介绍了使用深度学习解决计算机视觉问题的应用前景。旨在说明使用深度学习和人工智能实现计算机视觉是未来的发展方向,也是必然趋势。
第2章介绍Python的安装和最常用的类库。Python语言是易用性非常强的语言,可以很方便地将公式和愿景以代码的形式表达出来,而无须学习过多的编程知识。本章也介绍Python专用类库threading的使用,这个类库并不常见,但是为后文的数据读取和TensorFlow专用格式的生成打下基础。
第3章全面介绍机器学习的基本分类、算法和理论基础,也介绍不同算法,例如回归算法和决策树算法的具体实现和应用。这些是深度学习的基础理论,通过这些内容向读者透彻而准确地展示了深度学习的结构与应用,为后文中更进一步掌握深度学习在计算机视觉中的应用打下扎实的基础。
第4章主要介绍Python语言的使用。通过介绍和实现不同的Python类库,既帮助读者强化了Python的编程能力,也学习了相应的类库,这些都是在后文中反复使用的内容。同时借用掌握的知识,学习了数据的可视化展示能力,这个技能在数据分析中是一项基本技能,具有非常重要的作用。
第5~6章是对OpenCV类库使用方法的介绍,本书是以图像处理为重点,因此对图像数据的读取、编辑以及加工是本书数据处理的重中之重。而OpenCV是Python中专门用以对图像处理的类库,通过基础讲解和进阶介绍使得读者掌握这个重要类库的使用,学会对图像的裁剪、变换和平移处理的代码编写。其中,第5章以例子的形式对卷积核的基础内容做了一个介绍,并用Python语言实现了卷积核的功能。卷积核是本书一个非常重要的基础,也是图像处理中一个非常重要的组成部分,通过编写相应的程序去实现卷积核对图像的处理,对掌握和理解卷积神经网络有很大帮助。
第7~8章是TensorFlow的入门基础,通过一个娱乐性质的网站向读者介绍了TensorFlow的基本应用,用图形图像的方式演示了神经网络进行类别分类的拟合过程,在娱乐的同时了解其背后的原理。
第9章是本书的一个重点,也是神经网络的基础内容,本章的反馈算法是解决神经网络计算量过大的里程碑算法,作者通过详细严谨的讲解,使用通俗易懂的语言,对这个算法进行了介绍,并且通过独立编写代码的形式,为读者实现了这个神经网络中最重要的算法。第9章的内容看起来不多,但是非常重要。
第10章开始正式进入了TensorFlow的程序设计内容,通过与Keras联合学习,遵循TensorFlow官网的建议,使用Keras作为模型框架的高级API对程序进行编写,通过多个小例子循序渐进地引导读者使用TensorFlow 2.0做出第一个TensorFlow 2.0程序。
第11章是应用卷积神经网络在TensorFlow框架上进行学习的一个基础教程,经过前面章节的介绍,本章采用卷积神经网络基本理论进行手写体的辨识,这是深度学习最基本的技能,也是非常重要的一个学习基础。在程序编写的过程中,作者展示了参数调整对模型测试结果的重要作用,这是目前市面上相关图书没有涉及的内容,非常重要。
第12~13章是本书新增的内容,第12章着重介绍一些基本理论,卷积神经网络的推导以及梯度更新反向传播的算法,而为了更好地让读者掌握其相关内容,使用了一个简单的例子做深入说明。第13章介绍TensorFlow 2.0新增的自带数据库和可视化工具TensorBoard。
第14章是ResNet的介绍,通过一个完整的例子,演示了使用卷积神经网络进行图像识别的流程。例子来自于ImageNet图像识别竞赛,所采用的模型也是比赛中获得准确率最高的模型。通过对示例每一步的详细分析,手把手地教会读者使用卷积神经网络进行图像识别。
第15章是本书新增的内容,通过对最新前沿方向的追踪,向读者介绍了最新的注意力机制在图像领域的应用,并讲解了最新型的图像处理模型SENET的细节和实现。这些内容都能够给读者带来更好的理解,并加深对模型的认识和掌握。
第16章是本书的特色之一,针对神经网络中一些较为常见而不易解答的问题做了一个统一的回复,其中既涉及理论也涉及最新的应用,读者可以有针对性地进行学习。
第17章介绍了对抗生成网络(GAN)的基本理论、应用以及相关的实现,并使用GAN网络实现了一个手写体的生成,当然既然可以生成手写体,那么生成其他的相关图片也是可以的。
第18章介绍了最新的前沿技术——图卷积神经网络,这是一个简单的应用,但是可以认为图卷积神经网络是未来一段时间发展的前沿和趋势,完全可能加强和加深目前的卷积神经网络的工作以及加大神经网络的应用范围。