神经网络与深度学习:基于TensorFlow框架和Python技术实现
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 绪论

1.1 人工智能

1956 年夏,在美国的达特茅斯学院,John McCarthy、Marvin Minsky、Claude Shannon、Allen Newel、Herbert Simon等科学家聚在一起,共同研究和探讨有关用机器模拟智能的一系列问题,并首次提出了“人工智能”这一术语,标志着人工智能这门新兴学科的正式诞生。

人工智能是计算机科学的一个分支,它试图让人们了解智能的实质,并生产出一种新的能以与人类智能相似的方式做出反应的智能机器。人工智能是研究使计算机模拟人的某些思维过程和智能行为的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。该领域的研究涉及机器人、语言识别、图像识别、自然语言处理和专家系统等[1]

实现人工智能是人类长期以来一直追求的梦想。虽然计算机技术在过去几十年里取得了长足的发展,但是实现真正意义上的机器智能至今仍然困难重重。截至目前,还没有一台电脑能产生“自我”的意识。伴随着神经解剖学的发展,观测大脑微观结构的技术手段日益丰富,人类对大脑组织的形态、结构与活动的认识越来越深入,人脑信息处理的奥秘也正在被逐步揭示。如何借助于神经科学、脑科学与认知科学的研究成果,研究大脑信息表征、转换机理和学习规则,建立模拟大脑信息处理过程的智能计算模型,最终使机器掌握人类的认知规律,是“类脑智能”的研究目标。

类脑智能是涉及计算科学、认知科学、神经科学与脑科学的交叉前沿方向。类脑智能的实现离不开对大脑神经系统的研究。众所周知,人脑是由几十亿个高度互连的神经元组成的复杂生物网络,也是人类分析、联想、记忆和逻辑推理等能力的来源。神经元之间通过突触连接来相互传递信息,其连接的方式和强度随着学习发生改变,从而将学习到的知识进行存储。

由模拟人脑中信息存储和处理的基本单元——神经元而组成的人工神经网络模型,具有自学习与自组织等智能行为,能够使机器具有一定程度的智能水平。神经网络的计算结构和学习规则按照生物神经网络设计。在数字计算机中,神经细胞接收周围细胞的刺激并产生相应输出信号的过程,可以用“线性加权和”及“函数映射”的方式来模拟;而网络结构和权值调整的过程可用优化学习算法实现。目前神经网络已经发展了上百种模型,在手写体识别、显著性检测、语音识别和图像识别、模式识别、人机交互、优化算法、深度学习等技术领域取得了非常成功的应用。