1.2.2 各领域产生的数据
随着信息化的不断深入,国家、机构、企业积累的数据已经越来越多,逐步形成数据资源。在各行各业的工作开展过程中,数据被不断地生产出来。政务活动生产了大量政府数据资源;科学研究过程生产了科学数据资源;经济社会运行过程生产了农业、金融、交通等数据资源;人们的日常生活生产了个人数据资源等。
(1)政府数据资源
政府数据资源是最重要也是数量占比最大的数据资源,与国计民生关系密切,价值密度高。政府数据资源大多来自履行管理国家事务、开展政府业务及管理各项公共事务的过程中所积累的政府内部和外部的相关数据。政府数据资源主要包括政府政务活动所形成的政务数据资源和由政府资金支持而形成的公共数据资源,如国家致力于建设的自然人数据库、法人数据库、空间地理数据库和宏观经济数据库,国家统计数据、海关数据等国民经济数据资源,民生数据、社会行为数据等公共社会数据资源[12]。
(2)科学数据资源
科学数据资源是最基本、最活跃的科技资源,更是推动经济社会发展的重要基础和工具。科学数据主要包括在自然科学、工程技术科学等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据。如世界各国都在利用卫星、望远镜等开展太空探测、地球勘探等,收集宇宙、大气、地球等自然数据,形成自然数据资源;人类基因组计划所产生的生命数据资源;国家建设的国家地球系统科学数据中心、国家气象科学数据中心等平台所形成的科学数据资源等。
(3)农业数据资源
农业数据资源主要指农业或涉农领域产生和使用的数据,主要包括种植业、林业、畜牧业、渔业等农业领域的数据资源,以及农业环境与资料、农业生产、农业市场等相关领域的数据资源。如种植业的类别和品种、生产环境、病虫害和自然灾害、生产灌溉等种植业数据资源;食品加工类型、质量安全监管、服务等农产品加工数据资源;中国农业信息网、中国农业科技信息网等农业信息网站的数据资源;世界农业科技发展动态数据库、农业科技项目数据库、中国国家农作物种质资源数据库等涉农数据库的数据资源等[13]。
(4)金融数据资源
金融数据资源主要是指金融行业及相关领域生产和使用的经济数据资源,主要包括传统金融行业和互联网金融的数据资源,以及与金融行业相关的数据资源等[14]。如实时行情数据、历史金融数据、统计数据、新闻资讯等证券期货数据资源;银行交易系统数据、业务处理采集数据、银行网站数据等银行业数据资源;保单、理赔单、电话营销录音、车险投保者驾驶违章记录数据等保险业数据资源;电子商务行为、各种缴费交易数据等交易数据资源;区域经济数据、商品贸易数据、财政税收数据等相关数据资源。
(5)交通数据资源
交通数据资源主要由交通行业运行和管理直接产生的数据、与城市交通相关的行业和领域导入的数据,以及来自公众互动的交通状况数据构成,主要产生于交通基础设施本身、交通系统的运行以及交通业务管理中的各种应用[15]。如线圈、摄像头等各类交通设施产生的数据;车载GPS产生的车辆位置信息数据;气象、环境、人口、规划、移动通信等交通相关行业导入的数据;公众通过微博、微信、论坛、广播电台等提供的与交通状况相关的文字、图片、音视频等数据。
(6)医疗数据资源
医疗数据资源是医生对患者开展诊疗、治疗,以及开展某种疾病研究或相关医疗事宜所产生和使用的数据,主要包括临床医疗数据资源、非临床医疗数据资源、医疗相关领域数据资源等[16]。如包括患者基本数据、入出转数据、诊断/治疗/处方、临床笔记等内容的电子病历数据资源;由X线检查、CT、B超、胃镜肠镜、血管造影等形成的医学影像数据资源;转录组学数据、蛋白质组学数据、代谢组学数据、癌症基因组学数据、肠道微生物组学数据等生物组学数据资源;文献典籍数据、药学数据、医疗事务数据、医保索赔数据等各类医疗数据资源。
(7)个人数据资源
个人数据资源主要是由人们日常生活中的各种活动和行为产生的数据。随着存储技术的不断更新,人们可以在TB级别的固定硬盘、GB级别的U盘或TB级别的移动硬盘等存储设备中存储大量的文档资料、数码照片、家庭视频以及收集到的其他数据,这些都是个人数据资源。