第1章 深度学习简介
1.1 机器学习与深度学习
1.机器学习
早在20世纪50年代,人们首次提出了人工智能(Artificial Intelligence,AI)。人工智能领域主要研究如何让机器完成通常由人类智能才能完成的复杂工作,这是一个对人的意识和思维进行模拟和学习的过程。
机器学习是人工智能的一个分支,它使用大量的数据通过算法进行训练进而得到相应的模型。当出现新的数据时,可通过训练完毕的模型对新数据进行预测。机器学习又可分为3类:有监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)和强化学习(Reinforcement Learning)。
·有监督学习:对于所有的训练样本,每个样本的标签都是人为标注的,即所有样本标签都是已知的。通过这些已知标签的样本去训练模型,将输入映射为相应的输出,使得模型拥有对训练样本识别分类的能力。有监督学习可分为统计分析与回归分析,其中统计分析又可分为二分类问题和多分类问题。
·无监督学习:对于所有的训练样本,每个样本的标签都是未知的。对于需要训练的模型来说,只能根据样本间的相似性,将相似性高的样本分成一类,而无法进一步预测到底是哪一类别。
·强化学习:强化学习强调如何基于环境而行动,以取得最大化的预期利益。强化学习能够让智能机器人在未知的环境中进行自我决策,并且这个决策过程不是间断性的,而是可以长期做出连续性的决策。也就是说只要涉及智能决策的问题,并且在符合强化学习的规则的情况下都可以应用。智能决策也就是在环境中连续不断地做出决策。在实际生活中,强化学习多应用于游戏博弈,最受瞩目的就是在围棋比赛中的AlphaGO。在比赛前期它通过不断自我博弈、与他人博弈的强化学习,最终在与人类的对决中胜出。
2.深度学习
深度学习模仿人类神经网络的工作方式,广泛应用于图像识别、语音识别、自然语言处理等多个领域。深度学习作为机器学习的一个分支,同样可以广泛应用于机器学习,如有监督学习、无监督学习和强化学习。目前,深度学习主要通过搭建神经网络架构的方式来实现,常用的神经网络有深度神经网络(Deep Neural Network,DNN)、卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)。神经网络搭建完成后,通过大量的样本对该神经网络进行训练,在训练的过程中不断优化网络层中的超参数,训练结束后便可得到神经网络模型,用该网络模型便可对新的样本进行预测。