一本书讲透数据治理:战略、方法、工具与实践
上QQ阅读APP看书,第一时间看更新

3.5 企业数据治理之器——7把利剑

正所谓“工欲善其事,必先利其器”,一套好的数据治理工具能让企业的数据治理工作事半功倍。

数据治理的本质是管理数据资产,改善数据质量,防护数据安全和个人隐私,以及促进数据应用。不同的企业由于需求特点不同,会用到不同的技术平台和工具。一般来说,数据治理平台和工具主要包含以下组件:数据模型管理、元数据管理、数据标准管理、主数据管理、数据质量管理、数据安全治理、数据集成与共享等。笔者称之为企业数据治理的7把“利剑”,如图3-7所示。

058-1

图3-7 企业数据治理的7把“利剑”

1. 数据模型管理

在企业信息化建设过程中,数据模型“藏”于数据库底层,业务人员和管理人员对其是无感知的,因而往往会忽视它。然而数据模型却是企业数据治理中最核心的那把“利剑”。数据模型对上是承载业务需求的元数据,对下是数据标准管理的内容。同时,数据模型是数据质量指标和规则定义的起点,是主数据和参照数据设计的根本,是数据仓库和BI的核心,也是数据安全管控的对象。

数据模型管理工具的功能主要有可视化建模、模型版本管理、数据模型管理、数据模型查询、数据模型浏览、数据模型分析等。

2. 元数据管理

元数据管理统一管控分布在企业各个角落的数据资源(包括业务元数据、技术元数据和管理元数据),按照科学、有效的机制对元数据进行管理,并面向开发人员、最终用户提供元数据服务,以满足用户的业务需求,支持企业业务系统和数据分析平台的开发和维护。元数据管理是企业数据治理的基础。

元数据管理工具的功能主要有元数据采集服务、应用开发支持服务、元数据访问服务、元数据管理服务和元数据分析服务。

3. 数据标准管理

从字面上理解,数据标准就是数据的既定规则,这个规则一旦定义,就必须执行。数据标准管理就是研究、制定和推广应用统一的数据分类分级、记录格式以及转换、编码等技术标准的过程。

从管理的对象上来看,数据标准主要包含三个方面的标准:

  • 数据模型标准,即元数据的标准化;
  • 主数据和参考数据标准;
  • 指标数据标准,如指标的统计维度、计算方式、分析规则等。

数据标准管理工具的功能主要有数据标准的编制、审批、发布和使用。

4. 主数据管理

主数据是企业最基础、最核心的数据,是企业最重要的数据资产,企业的一切业务基本都是基于主数据来开展的。

如果说大数据是一座矿山,那么主数据就是这座矿山中的金子。通过主数据可以解决各异构系统的数据不标准、不一致的问题,保障业务连贯性以及数据的一致性、完整性和准确性,提升业务条线之间的协同能力。同时,高质量的主数据能为领导的管理决策提供支撑。

主数据管理工具是企业数据治理中的核心实践之一。主数据管理工具的功能主要有主数据的建模、编码、管理、清洗、集成等。

5. 数据质量管理

持续提升数据质量是企业数据治理的核心目标。数据质量管理既可以是企业级的全面数据质量管理,也可以是面向某一特定业务主题的主题级数据质量管理。

在不同的数据治理项目中,对数据质量管理工具的使用各不相同,有时会单独使用,有时配合元数据使用,有时又配合主数据使用。数据质量管理的范围往往需要根据业务的需求和目标进行定制。

数据质量管理工具的功能主要有数据质量指标管理、数据质量规则管理、数据质量评估任务和数据质量评估报告。

6. 数据安全治理

在企业数据治理中,数据安全一般作为企业数据治理的一道“红线”,任何人、任何应用都不可逾越。不过数据安全也不能随意使用,否则就会影响业务效率,因此需要在安全和效率之间找到一个平衡点。

数据安全涵盖操作系统安全、网络安全、数据库安全、软件应用安全等。数据安全治理的侧重点是控制数据的使用过程,以保证数据被安全合法地使用,因此管理的重点在应用上。

数据安全治理工具的主要功能一般包括身份认证、访问控制、分类分级、数据授权、安全审计、数据脱敏、数据加密等。

7. 数据集成与共享

数据本身并没有价值,被合理使用的数据才会产生价值。数据的集成与共享有多种方式,比如数据集成、数据交换、数据开放等。数据集成与共享工具是用于促进数据高效集成和共享的一系列工具。

主流的数据集成工具主要有企业服务总线(ESB)、ETL工具、流数据集成工具等,不同的集成场景使用的工具不同。