AI数字人原理与实现
上QQ阅读APP看书,第一时间看更新

1.3 数字人的分类

数字人是一种由多种技术构建而成的系统,其分类方式多样。下面将按外观、用途和智能级别来对其进行分类。每一类数字人都有着独特的技术特性及应用价值。掌握数字人的分类有助于更好地规划需求或制定数字人解决方案。

全面理解数字人的分类是应用数字人技术的首要步骤。这些分类为我们提供了设计、评估和选择数字人方案时的参考依据。不同类别的数字人具有不同的应用优势,未来数字人也会向更多元、更专业的方向发展。

1.3.1 根据外观分类

从视觉呈现效果的角度,可以将数字人分为2D和3D两种形式。

1.2D数字人

纯2D数字人的典型应用包括早期的网络虚拟偶像,以及应用程序和小程序中的简单2D虚拟角色等。2D数字人采用2D平面图像的形式展示,包括手绘或计算机生成的2D卡通形象。它们的优势是创作简单、灵活,需要的存储空间小且计算量不大,渲染的计算量也较小。然而,由于其视觉效果和交互能力相对有限,纯2D数字人的应用场景逐渐减少。

2.3D数字人

3D数字人广泛用于虚拟主播、数字艺人等场景,这些数字角色可通过构建3D人体模型来呈现。3D人体模型可以通过3D建模或3D扫描来构建。虽然3D数字人的视觉效果更丰富,但制作过程更复杂,且计算量更大。相比2D数字人,3D数字人具有更强的代入感和交互性,更适合对外观真实性要求较高的应用场景。

还可以根据逼真程度将3D数字人分为精准3D数字人和非精准3D数字人。前者更逼真,适合对真实感要求高的应用场景。我们相信,随着3D数字人技术的发展,在未来可能会出现更高精度的数字人。

1.3.2 根据用途分类

从应用场景的角度,可以将数字人分为两类:娱乐休闲型数字人和商业工作型数字人。每个类别都有其独特的技术特性和应用场景。

1.娱乐休闲型数字人

娱乐休闲型数字人主要面向大众娱乐、游戏等非专业化领域,其特征是外观与形象设计活泼且多样化,角色设置上尤其强调创新和趣味性。典型的例子包括虚拟偶像和网络游戏角色。这类数字人对交互实时性要求较高,需要具有逼真的视觉效果,能够完成流畅的动作,还需要具备一定的人格魅力,以吸引目标用户群。总体来说,这些数字人以提供乐趣和正向情感为中心,这决定了其设计的自由度较高。

2.商业工作型数字人

娱乐休闲型数字人适用于专业领域,如教育、客服、金融等。它们需要具备专业知识,以完成实际工作任务。它们的形象设计相对简单、规范,因为其核心优势在于交互能力,而不是外观。它们需要具备强大的对话理解、知识表达和推理能力,以有效地处理专业问题。它们还需要具备持续学习的能力,以不断提高专业水平。总体而言,商业工作型数字人以实用性为中心,这决定了它们的设计必须围绕专业需求展开。

随着数字人技术的发展,不同类型的数字人之间的界限将越来越模糊,数字人的应用范围也将越来越广泛。

1.3.3 根据智能级别分类

从智能级别的角度,数字人可以分为交互型数字人和自主思考型数字人。

1.交互型数字人

交互型数字人简单、易用、技术门槛低。它们不能理解复杂语义或自主思考,只能根据预设模式进行语音或动作响应,实现一定程度的人机交互。交互型数字人仅具备基本的听觉和视觉交互能力。

2.自主思考型数字人

自主思考型数字人集成了自然语言理解、知识表达、自动推理等更强大的人工智能技术,可以进行复杂的语义分析,利用知识库进行自主回应,并做出独立的判断。自主思考型数字人的交互方式更加开放和智能,用户可以与其进行更多样、更深入的交流。自主思考型数字人需要持续的学习才能满足更自然、更深入的交流需求。

目前,大多数字人仍然属于交互型范畴,与理想的自主思考型数字人标准仍有较大差距。随着技术的发展,未来数字人将从有限交流往自主、自然交流方向发展。这将大大拓宽数字人的应用场景,能够真正帮助和服务人类。