前言
2016年,AlphaGo与李世石的围棋对弈引发了全世界的关注。这是继1997年IBM深蓝与加里·卡斯帕罗夫的国际象棋比赛后人工智能(AI)领域又一打破圈层的里程碑式事件。这次人机大战以AlphaGo 3.5︰2.5胜利,人工智能也因此真正进入大众视野,迎来了新一波的发展热潮。
而自2020年开始的新冠肺炎疫情又进一步推波助澜。疫情发生后,人工智能技术被引入疫情监测分析、药品研发、医疗救治、人员物资管控、后勤保障等疫情防控工作中,并发挥了重要作用,成为抗疫情、稳增长、保民生的关键支撑。同时,传统的零售、餐饮、酒店、娱乐、交通、旅游、教育等第三产业在疫情的严重冲击下,不得不改变既有的服务方式与购买方式,向线上化、数字化、智能化的方向发展。可以说,整个社会都被倒逼着加速向智能化转型。
这一趋势在相关的报告数据中可见一斑。根据国际数据公司(IDC)最新发布的数据,2022年全球人工智能市场的收入将实现19.6%的同比增长,达到4 328亿美元,并将在2023年突破5 000亿美元大关。在中国,人工智能的发展势头同样强劲。据相关数据,中国人工智能市场规模由2016年的154亿元增长至2020年的1 280亿元,年均复合增长率为69.9%。中商产业研究院预测,2022年中国的人工智能市场规模将达2 729亿元。
在人工智能市场前景越发明朗的情况下,人工智能人才的需求也随之激增。然而由于我国人工智能起步较晚、前期积累不足,人工智能产业面临着有效人才供给不足的窘境。2019年人社部等三部门联合发布的《新职业——人工智能工程技术人员就业景气现状分析报告》测算,我国人工智能人才缺口超过500万,国内供求比例为1∶10,供求比严重失衡,如不加强人才培养,至2025年人才缺口将突破1 000万。
在产业对人工智能人才的需求中,懂AI(人工智能)算法的算法研发工程师由于作用巨大且门槛较高,一直是最稀缺的人才。此外,和传统互联网应用类似,人工智能应用的落地也需要有相应知识背景的产品经理、应用开发、交付运维、市场销售、高级管理等岗位人才的协同参与。而随着行业发展带来的分工细化,人工智能产业还诞生了一个特有的岗位,那就是人工智能训练师。
人工智能训练师的出现与人工智能技术在客服行业的落地密切相关。作为聊天机器人的商业化应用,智能客服专注于回答用户关于产品或服务的问题,可以为企业带来降本增效的巨大价值,近年来应用颇为广泛。虽然智能客服可以通过语音识别、自然语言处理(natural language processing,NLP)、语音合成等AI技术与用户进行交互,但受限于当前的技术水平,智能客服要想精准理解并回答用户的问题,还需要人工智能训练师对其进行一番“训练”才行,即完成业务知识的维护、交互数据的标注、效果测试与优化等工作。
随着人工智能技术的应用场景不断增加,人工智能训练师不再局限于智能客服领域,其工作边界不断扩展、工作内容越发丰富。他需要了解人工智能的基本概念、算法的基础原理,也需要掌握人工智能产品的所有功能,还需要熟悉具体行业的实际业务场景,才能最终优化人工智能的应用体验。在不同技术背景的公司里,人工智能训练师所承担的工作内容也大相径庭,有的更偏向数据标注,有的更偏向业务运营,还有的甚至会参与产品设计和算法调优。如果要对这一职业进行一个明确的界定,人社部给出的定义或许最为合适,即“使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员”。
本书参考了人社部发布的《人工智能训练师国家职业技能标准(2021年版)》,并结合编者的行业经验,力图兼顾理论与实践、专业与通俗,以达到使读者掌握人工智能训练师职业基础知识与技能的目的。本书共六章,分别为:人工智能概述、人工智能数据采集与处理、人工智能数据标注、人工智能系统运维基础、人工智能业务分析基础、人工智能常见算法,涵盖了人工智能训练师基础工作的方方面面。本书既可作为人工智能训练师的培训教材,也可作为人工智能的科普读物供广大读者自学或参考。
本书由长期从事人工智能产业应用一线工作的技术专家人员共同完成,韩璐、向孟秋、蔡夫凡、霍雅祺、刘美、施倩、张旭衡、史雨晗、李明阳、陆萧、张媛、李媛、张潇允、莫杰连、李思敏等专业工程师协同参与了内容编写,对相关编者的用心思考、细心撰写表示由衷的感谢。另外本书参考、借鉴了一些专著、教材、论文、报告和网络上的成果、素材、结论或图文,受篇幅限制没有在参考文献中一一列出,在此一并向原创作者表示衷心感谢。
由于时间仓促,编者水平有限,不足之处在所难免,恳请广大读者批评指正。
编者
2022年10月