前言
作为第四次工业革命的关键技术之一,人工智能(Artificial Intelligence,AI)不仅在多个领域得到应用,而且受到社会大众的广泛关注,越来越多的人希望学习和了解人工智能。自1956年人工智能的概念提出以来,人工智能在六十多年的发展中经历了三次高潮和三次低谷,形成了庞大的理论体系,但最近广泛应用的是以深度学习为代表的新一代人工智能,这也将是本书介绍的主要内容。
算力、算法和数据作为新一代人工智能的三要素,具有一定的学习门槛。近年来,国内很多高校增设了人工智能专业。为培养人工智能方面的高级专门人才,高校、教师和学生需要付出很多努力:高校需要购买昂贵的设备以解决算力问题,教师需要通过漫长的过程教授复杂的理论以解决算法问题,学生需要编写代码来验证和实现神奇的人工智能算法。
根据笔者多年的教学经验,对于业余人士,如果采用传统的教学模式,一行代码可能会吓跑一半的学习者,两行代码会吓跑剩余的学习者,更不要说代码背后复杂的理论和算法了。那么,非人工智能专业人士能不能学习新一代人工智能呢?
答案是肯定的。
本书旨在为所有人工智能爱好者(包括但不限于非人工智能专业的高校学生、希望使用人工智能解决所在领域问题的工程技术人员)提供零门槛的人工智能学习方法,即使用无代码的人工智能开发平台来学习新一代人工智能。本书选用了百度公司开发的零门槛无代码人工智能开发平台——EasyDL平台,其含义为“容易学习的深度学习”。该平台基于百度公司深厚的人工智能积累和多年的产业沉淀,功能多样、操作方便、界面友好、使用限时免费。
目前,市场上常见的人工智能教程可以分为两类:一类是以讲授人工智能基本算法和理论为主,学习成本高且不直观;另一类以介绍人工智能概念理解、应用和人工智能伦理为主,长于叙事而短于实践。
与传统的人工智能教程不同的是,本书试图破解算力、算法和数据三要素难以具备的难题,为人工智能的快速普及和推广开辟新的路径。
1.算力要素的解决保证“人人都能学AI”
基于百度公司的EasyDL平台提供的限时免费在线算力服务,读者无须准备计算设备和进行框架安装和配置。这扫清了人工智能学习算力要素的障碍。
2.算法要素的解决保证“人人都能用AI”
百度公司的EasyDL平台很好地封装了人工智能算法,可以实现全程无代码、真正零门槛,读者无须学习前置课程和高深理论。这扫清了人工智能学习在算法要素方面的障碍。
读者只需跟随本书教程,点击鼠标即可训练人工智能模型、查看模型结果、测试模型性能,甚至可以使用智能手机扫描二维码调用模型并分享给亲朋好友,轻松享受AI学习过程,真切感受AI学习成果。
3.数据要素的拓展保证“人人都能创作AI”
在传统的人工智能学习中,限于知识和能力,初学者只能使用固定数据实现和验证前人建好的模型,即采用“走别人走过的路”的模式进行学习。
本书选择的EasyDL平台为用户使用人工智能解决问题提供了极大的自由度:支持和鼓励读者自己定义和设计问题、自己收集和上传数据、自己标注数据,最终创作属于自己的AI模型。这些问题可能与读者深耕多年的专业/行业背景经历有关,也可能来自读者生活中的灵光一现,但无论如何,每位读者都可以尝试创作AI模型,使自己成为一名“AI创客”。
从数据要素角度来看,EasyDL平台极大地拓宽了数据要素的来源,为人工智能在更多行业的应用提供了无限可能,在人工智能尚未应用的领域开疆拓土,即“走一些别人没有走过的路”。
通过本书的学习,读者能够对如下问题有深刻且直观的认识。
人工智能可以做什么?
本书介绍了人工智能在图像、语音和文本3个方面的多项处理实例。通过这些实例,读者可以沉浸式地体验人工智能的能力,并培养初步的判断能力:人工智能能否解决某个问题,以及应该选择哪种人工智能功能来解决问题。
人工智能需要什么?
数据是人工智能的燃料,但并非所有的数据都是可用的。通过实践操作,读者可以具备初步的数据感知、判断和编辑能力:对某个具体问题而言,人工智能需要什么样的数据,什么样的数据是有效的以及什么样的数据是无效的,如何对数据进行标注和编辑。明确人工智能对数据的要求,有助于读者在今后人工智能开发中设计合理的数据收集方案,少走弯路,缩短模型开发周期。
人工智能处理结果是什么?
基于EasyDL平台强大且丰富的功能,读者不仅可以直观地看到模型的处理结果,培养“AI感觉”,提高AI素养,而且可以使用该平台创作人工智能模型,验证自己的判断并部署和调用模型。
良好的判断能力、数据感知能力和结果阅读能力将有助于读者扩展人工智能应用范围,缩短人工智能产品开发周期,加速人工智能落地。
本书包括正文和附录两部分,其中正文分为9章。第1章介绍人工智能的概念、产业结构和应用领域,引导读者在百度AI能力体验中心体验人工智能的魔力;第2章介绍人工智能产品开发流程以及EasyDL平台的功能和使用方法;第3章介绍图像智能分析,包括图像分类、物体检测和图像分割;第4章介绍文本智能分析,包括文本分类、短文本相似度分析和情感倾向分析;第5章介绍语音智能分析,包括声音分类和语音识别;第6章介绍EasyDL OCR的应用方式;第7章介绍EasyDL平台训练的AI模型如何在EdgeBoard上部署;第8章介绍基于EasyDL平台的人工智能学科竞赛;第9章介绍EasyDL平台对多个行业进行赋能的案例。
本书附录包括4部分,附录A介绍了EasyDL平台的功能更新记录;附录B介绍了飞桨EasyDL桌面版的操作;附录C介绍了如何利用labelImg对物体检测任务进行数据标注;附录D补充了人工智能在其他行业的案例。
芦碧波撰写了第1章、第2章和第6章,王春阳撰写了第3章、第9章、附录A、附录B和附录C,张建春撰写了第4章、第5章和附录D,苏柏顺撰写了第7章和第8章。
感谢百度公司长久以来对高校人工智能教育的支持,感谢百度公司飞桨事业部谢梦、钱芳、刘芸在本书筹划过程中的帮助,感谢百度公司校园品牌事业部对本书撰写的鼓励,感谢人民邮电出版社编辑在本书撰写和修改过程中付出的辛勤工作。
感谢参与本书所用数据集制作、数据标注、案例测试的河南理工大学计算机科学与技术学院人工智能和计算摄影研究室多名研究生和其他本科生,由于人员众多,此处不再一一列出。
本书受到河南省教育科学“十四五”规划重点课题“河南高校AI+X人才培养与应用创新体系建设研究”(编号:2021JKZD06)的资助,在此一并致谢。
撰写一本无代码的人工智能教程,不仅对本书作者是一种新的尝试,对国内人工智能教育领域也是一种新的思路。由于作者水平有限,书中可能存在诸多不足,欢迎广大读者提出宝贵意见,以便今后能够持续改进。
希望本书的出版和发行能够促进人工智能的普及,培养更多的人工智能应用人才和“X+AI”的复合型人才。
编著者