数据血缘分析原理与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

前言

创作本书的初衷

我们发现,近年来,国内企业数字化程度节节高升。企业最初只是进行简单的数据线上化记录,后来发展到用数据做分析,用数据做决策,到现在用数据实现企业智能管理。随着技术的不断迭代更新,企业对数据有了更高的应用需求。越来越多的企业发现了数据潜在的巨大价值,加之数据被国家定义为新型的生产要素,这些都必然促使企业更加重视数据管理,追求更加准确完整的数据,以应对日益透明和激烈的市场竞争,提升企业的工作效率。要用好数据,就需要提高数据质量,而要提高数据质量,就必然会用到数据血缘分析。

数据血缘是近年来比较热的话题,从事数据相关工作的人员越来越注重数据血缘的价值和影响。但是数据血缘分析入门门槛较高,市面上相关的图书也比较少,这就导致很多从业者对数据血缘认知严重不足,比如我们经常看到有人会就数据血缘的定义、作用争吵不休,就更别提把数据血缘分析充分利用起来的方法论了。数据血缘的本质是什么?数据血缘的应用场景是什么?如何构建数据血缘分析系统?如何把数据血缘分析落地到数据管理工作中?这些成为当前急需解决的问题。作为多年的数据治理从业者,我们研究数据血缘很多年了,并且形成了自己的方法论。我们的方法论在多家公司进行过分享和实践,都取得了很好的效果。看到行业内存在上述痛点,我们产生了撰写这本书的想法。

读者对象

本书适合数据管理方向的从业者,包括数据治理人员、数据产品开发人员、数据资产/资源评估或管理人员、IT咨询顾问、数据架构师、系统分析师、商业智能架构师、信息化咨询顾问阅读。

本书亮点

要想真正做好数据血缘分析,并最终实现数据质量的提升,就必须从原理层面理解数据血缘的本质,掌握数据血缘分析的根本逻辑;要想真正把数据血缘分析落地到实际工作场景中,就必须给出可落地的数据血缘分析系统构建方法,给出落地到具体工作场景的具体指导,给出相关的工具。本书就是这样一本理论和实践兼备的图书。

原理层面,本书首先集中对数据血缘的本质、数据血缘的应用场景、数据血缘中的数据进行深度剖析,然后在后面的实践部分,也尽量先从原理层面对相应操作或产品进行本质分析;实践层面,本书不仅给出了数据血缘分析系统建设的方法论,还结合应用场景和典型案例对数据血缘分析落地方法进行了深入阐述。为了帮助初级读者快速把数据血缘分析用起来,本书甚至可以让读者按照书中的步骤操作,就搭建起自己的数据血缘分析系统。

本书主要内容

本书分为5篇,包括概念篇、建设篇、技术篇、案例篇和展望篇。全书采用由浅入深的介绍方式,从原理和实践两个角度对数据血缘及数据血缘分析进行深度剖析。其中概念篇主要带领读者整体认识数据血缘,揭开数据血缘的神秘面纱;建设篇重点介绍数据血缘分析系统的建设方法及步骤;技术篇介绍与数据血缘相关的技术及其应用方法,这是提升数据质量的关键,数据治理、数据资产管理相关人员需要重点关注这部分内容;案例篇对互联网、服务、制造、零售快消这几个具有代表性的行业的数据血缘落地案例进行深度解读,重点介绍优秀企业如何基于数据血缘进行数据管理;展望篇对数据血缘未来的价值和应用方向进行了预测。