大数据可视化
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2.2 分析模型

图2-15是典型的可视分析模型,起点是输入的数据,终点是提炼的知识。可视分析是从数据到知识,从知识到数据,再从数据到知识的循环过程。从数据到知识的途径有交互的可视化方法和自动的数据挖掘方法。这两个途径的中间结果分别是对数据的交互可视化结果和从数据中提炼的数据模型。用户既可以对可视化结果进行交互的修正,也可以调节参数以修正模型。从数据中洞悉知识的过程也主要依赖两条主线的互动与协作。

图2-15 可视分析模型

数据可视化分析流程中的核心要素包括以下4个方面。

1.数据表示与转换

数据可视化的基础是数据表示与变换。为了允许有效地可视化、分析和记录,输入数据必须从原始状态到一种便于计算机处理的结构化数据表示形式。通常这些结构存在于数据本身,需要研究有效的数据提炼或简化方法以最大限度地保持信息和知识的内涵及相应的上下文。有效表示海量数据的主要挑战在于采用具有可伸缩性和可扩展性的方法,以便忠实地保持数据的特征和内容。此外,将不同类型、不同来源的信息合成为一个统一的表示,可使得数据分析人员能及时聚焦于数据的本质。

2.数据的可视化呈现

将数据以一种直观、容易理解和操纵的方式呈现给用户,需要将数据转换为可视化表示并呈现给用户。数据可视化向用户传播了信息,而同一个数据集可能对应多种视觉呈现形式,即视觉编码。数据可视化的核心内容是从巨大的呈现多样性空间中选择最合适的编码形式。

3.用户交互

对数据进行可视化和分析的目的是解决目标任务。有些任务可明确定义,有些任务则更广泛或者一般化。通用的目标任务可分成3类:生成假设、验证假设和视觉呈现。数据可视化可以用于从数据中探索新的假设,也可以证实相关假设与数据是否吻合,还可以帮助数据专家向公众展示其中的信息。交互是通过可视化的手段辅助分析决策的直接推动力。有关人机交互的探索已经持续很长时间,但适用于海量数据可视化的智能交互技术,如任务导向的、基于假设的方法还是一个未解难题,其核心挑战是新型的可支持用户分析决策的交互方法。这些交互方法涵盖底层的交互方式与硬件、复杂的交互理念与流程,更需要克服不同类型的显示环境和不同任务带来的可扩充性难点。

4.分析推理

分析推理技术是用户获取深度洞悉的方法,能够直接支持情景评估、计划、决策。在有效的分析时间内,可视分析必须提高人类判断的质量。可视分析工具必须能处理不同的分析任务,例如:

(1)很快地理解过去和现在的情况,同时包括趋势和已经产生的当前事件。

(2)监控当前的事件、突发的警告信号和异常事件。

(3)确定一个活动或个人意图的指标。

(4)在危机时刻提供决策支持。

通常在极端的时间压力下,用户个人与协作分析相结合产生这些任务。可视分析必须能采用基于假设、基于情景的分析技术,提供基于现有证据的分析推理支持。

在未来,分析必须满足多种新的需求,这是由硬件、软件和网络基础设施技术的快速发展而产生的。除了高维数据等挑战外,因为评估必须立即在给定的时间框架内进行,所以连续数据流需要有额外的限制。这些挑战对数据分析和可视化提出了重要的要求。