1.2 基础模型和模型中心_生成式AI入门与AWS实战-QQ阅读男生科幻网

上QQ阅读APP看书，第一时间看更新

1.2　基础模型和模型中心

基础模型（foundation Model）是由数十亿个参数（又称权重）组成的非常庞大而复杂的神经网络模型。模型参数是在训练阶段不断优化和学习的——这个阶段通常称为预训练（pre-training）。基础模型在大量训练数据上进行训练——通常在几周甚至几个月的时间内，使用大型分布式CPU和GPU集群来训练。在学习数十亿个参数之后，这些基础模型可以表示诸如人类语言、图像、视频和音频等复杂实体。

在大多数情况下，我们将从模型中心（如Hugging Face Model Hub、PyTorch Hub或Amazon SageMaker JumpStart）开始生成式AI项目。模型中心是模型的集合，通常包含详细的模型描述以及它们所针对的用例。

在本书中，我们将使用Hugging Face Model Hub和Amazon。SageMaker JumpStart来访问Meta（原Facebook）的Llama 2、Technology Innovation Institute（TII）的Falcon以及Google的FLAN-T5等基础模型。我们将在第3章中深入了解模型中心和基础模型。

接下来，我们会介绍一个典型的生成式AI项目的生命周期，本书后续内容也会大致按照这个流程来展开。