大模型时代的基础架构:大模型算力中心建设指南
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

推荐序二

随着2006年AWS发布S3和EC2,云计算的商业大幕正式开启,IT世界进入云计算时代。2015年,AWS首次推出Amazon Machine Learning服务,这标志着机器学习和人工智能服务成为云计算领域的生力军。2022年11月,ChatGPT横空出世,因其卓越的能力,被称为有史以来向公众发布的最佳人工智能聊天机器人。ChatGPT在短时间内席卷全球,让“GPT”“大模型”这些词汇变得耳熟能详。ChatGPT的出现,不仅让AI领域翻开了新的篇章,还大大推动了云计算领域的发展。

ChatGPT优异能力的背后,大模型技术是关键。人们相信,以ChatGPT为代表的大模型技术开启的本轮科技浪潮,其重要性将超过以往任何一次AI技术突破。

国内产投研各方均已加快布局大模型。百度的文心一言、阿里巴巴的通义千问、华为的盘古、京东的言犀、腾讯的混元、商汤的日日新等大模型先后登场。据不完全统计,目前,我国已推出的通用大模型有一百多个,若算上各类行业大模型,更达数千个。于是,人们用“千模大战”来形容目前的产业态势。

大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都展现了显著优势和巨大潜力。IDC建议,大模型在推进产业智能化升级的过程中已展现巨大的潜力,企业应该尽早关注。

与此同时,行业专家普遍认为,公有云上的大模型服务对于大中型企业来说有几个短板,比如:大模型是“通才”,行业深度不够;可能存在数据安全隐患;企业内部数据更新速度快,公有大模型无法及时更新数据;无法实现成本可控。对于拥有敏感且高价值数据的大中型企业来说,大模型的行业化、企业化、垂直化、小型化、专有化变得尤为关键。

相信在不久的将来,有关大模型的基础架构将成为大中型企业云计算基础设施的一个关键组成部分。但是,对于企业来说,与以计算、存储、网络、数据库等中间件为代表的传统云计算服务相比,该基础架构的落地和使用面临诸多挑战,比如:大模型和软硬件不好选择;在大模型的基础设施建设和维护方面,技术门槛高、人才储备不足;等等。

本书的出现恰逢其时:目前,大中型企业正处于在其数据中心内建设大模型基础设施的关键阶段,本书可为其提供指导。

本书不但讲解了大模型相关的基础技术,比如AI基本概念、GPU硬件、软件、虚拟化等,还讲解了大模型基础设施的核心内容,包括GPU集群存储、网络、I/O、算力调度、网络虚拟化、管理和运营等,并结合实际案例,讲解了如何进行机器学习应用开发与运行平台设计,在此过程中把本书中的重点内容“串联”起来进行了讲解,以期读者建立整体的认知。

正如作者的名字一样,希望本书能成为助力国内大模型基础设施建设的“方天画戟”。也希望读者喜欢本书,能在阅读本书后有真正的收获。还希望国内的大模型发展得越来越好!

腾讯云TVP,“世民谈云计算”微信公众号作者 刘世民

2024年4月21日写于上海