上QQ阅读APP看书,第一时间看更新
1.2 基础模型和模型中心
基础模型(foundation Model)是由数十亿个参数(又称权重)组成的非常庞大而复杂的神经网络模型。模型参数是在训练阶段不断优化和学习的——这个阶段通常称为预训练(pre-training)。基础模型在大量训练数据上进行训练——通常在几周甚至几个月的时间内,使用大型分布式CPU和GPU集群来训练。在学习数十亿个参数之后,这些基础模型可以表示诸如人类语言、图像、视频和音频等复杂实体。
在大多数情况下,我们将从模型中心(如Hugging Face Model Hub、PyTorch Hub或Amazon SageMaker JumpStart)开始生成式AI项目。模型中心是模型的集合,通常包含详细的模型描述以及它们所针对的用例。
在本书中,我们将使用Hugging Face Model Hub和Amazon。SageMaker JumpStart来访问Meta(原Facebook)的Llama 2、Technology Innovation Institute(TII)的Falcon以及Google的FLAN-T5等基础模型。我们将在第3章中深入了解模型中心和基础模型。
接下来,我们会介绍一个典型的生成式AI项目的生命周期,本书后续内容也会大致按照这个流程来展开。