机器学习系统:设计和实现
上QQ阅读APP看书,第一时间看更新

FOREWORD序

时至今日,AI的重要性无须多言。AI已然渗透到我们生活的方方面面,智能车、智能手机、智能家居等智能化生活场景的出现,正在逐渐改变我们的生活方式。以深度学习为代表的AI技术也得到了蓬勃发展。在计算机视觉、自然语言处理等AI算法方面,取得了重大的突破和进展,算法的精度、泛化性和可用性进一步提升;在AI系统方面,也出现了以华为公司的Ascend(腾)芯片、GPU为代表的AI硬件,以MindSpore(思)、PyTorch为代表的机器学习系统……它们使得AI训练、推理的性能和算法开发部署效率进一步提升。

2019年,来自斯坦福大学的众多专家学者共同发布了将“机器学习系统”作为一个独立学科的白皮书,并讨论了其主要关注的问题,包括如何设计支持全生命周期的软件系统(编程接口、数据预处理等),如何设计机器学习硬件系统(专用异构硬件设计、分布式支持等),如何满足功能外的需求(如安全、隐私保护、能耗等)。而这些问题和方向,都可以在本书中找到相关方向的丰富知识和实践案例。

应用创新、硬件演进、技术进步是计算机系统研究的三大驱动力,机器学习系统也是如此。AI应用的算法模型从小模型、大模型到超大模型,AI部署的场景已经覆盖端、边、云全场景,AI算法模型的迭代速度越来越快,很多场景要求模型是小时级、分钟级甚至是实时更新的。AI硬件算力正以十倍或百倍的速度演进,让我们看到了后摩尔时代算力DSA架构(Domain Specific Architecture)的黄金十年。AI的训练、推理、部署技术也在快速进步。从支持单机训练推理,到集群训练、超大规模集群训练;从支持CPU,到支持CPU、GPU、NPU等XPU组成的多样性算力;从只支持单一模型训练到多模训练,从支持深度学习到支持强化学习、联邦学习等……上述趋势和变化给机器学习系统带来了新的挑战和新的机会,也让机器学习系统成为当前最热门、最有影响力的学科之一。

本书凝结了麦络老师、董豪老师、MindSpore的设计者以及来自世界各地的AI系统专家的心血,全面地介绍了机器学习系统设计者所需的全面的知识体系和实践经验,希望帮助更多的学生、工程师和研究人员,从机器学习系统的使用者成为机器学习系统的设计者和开发者。通过研读本书,您将对机器学习系统全貌有更深入的了解,助力您开发下一代AI技术,也希望有越来越多的人关注和参与到机器学习系统方向的研究和研发中来。

上海交通大学特聘教授

华为基础软件首席科学家

(陈海波)