让数据成为生产力:数据全生命周期管理
上QQ阅读APP看书,第一时间看更新

2.1.4 结构化与非结构化如何转换

结构化数据和非结构化数据并非对立的。两者之间有差别,但也是可以相互转换的。非结构化数据可以转换为结构化数据,这不是偶然性的,而是数据应用的必然性、现实性的过程,这对于挖掘数据潜能、实现数据的应用价值意义非凡。非结构化数据不是那么容易组织或格式化的,收集、处理和分析非结构化数据也是一项重大挑战。

根据IDC预测,2026年全球数据圈将达到221ZB,而这些数据中大部分是非结构化数据,非结构化数据的治理以及应用已经成为决定企业数字经济发展速度的重要因素。因此,非结构化数据向结构化数据的转变成为很多企业孜孜以求的攻关重点,许多机构也投入这项研究中,很多企业竭力保留了各种客户数据、业务数据、内部流程以及运营数据等,但是它们的数据科学家发现将这些裸数据进行清理以及分类,然后变成商业智能以及分析平台处理的内容却并非易事,需要使用高深的技术和昂贵的工具,并且非常耗时耗力。

中国互联网行业正处于高速发展期,释放非结构化数据背后的价值成为国内互联网企业角逐的目标。随着越来越多的非结构化数据进入结构化IT环境,尤其是来自于大量物联网设备的流媒体数据和大量的标记视频数据,机构有机会将这些数据转换为信息和知识。具有远见卓识的国家和企业机构可以从中获取全新的、创新的洞察力,以推出新产品和新服务,从而充分挖掘这口蕴藏丰富的智慧之井。