Ray分布式机器学习:利用Ray进行大模型的数据处理、训练、推理和部署
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

过去10年,机器学习和数据应用程序的计算需求不断攀升,即使运用了GPU和TPU等硬件加速器,计算量也远远超过了单台服务器或单个处理器的能力。而且,这种趋势愈演愈烈,迫使人们只能选择进行分布式处理。不过,创建分布式应用程序一向都是非常困难的。

在过去几年中,Ray已经成为开发分布式应用程序的首选框架,因为它拥有灵活的内核和一套强大的库,使开发人员能够轻松扩展各种工作负载,包括训练、超参数调优、强化学习(Reinforcement Learning,RL)、模型服务和非结构化数据的批处理。Ray是当下非常受欢迎的开源项目,已有上千家公司利用Ray开发机器学习平台、推荐系统、欺诈检测、大模型等各种应用,其中就包括Open AI大名鼎鼎的ChatGPT。

在这本书中,Max Pumperla、Edward Oakes和Richard Liaw用通俗易懂的示例全面介绍了Ray。通过阅读本书,读者将掌握Ray的关键概念和方法,并能从笔记本计算机扩展到本地或云端的大型集群,开发并快速扩展端到端的机器学习应用程序。

——Ion Stoica

Anyscale和Databricks联合创始人

加利福尼亚大学伯克利分校教授

2023年1月