第六章 数据开放评估
随着开放数据受到各国普遍关注和重视,越来越多的国家和地区加入数据开放行动中,纷纷将数据开放纳入国家战略。本章将介绍几种影响力较大的数据开放评估体系,这些评估体系从不同视角对各国和地区数据开放情况进行评估,从中可以看到各国数据开放政策的落实情况、数据开放的整体发展水平、各国数据开放水平在国际上所处的位置以及所面临的问题和挑战。
第一节 开放数据晴雨表
开放数据晴雨表(Open Data Barometer,简称ODB)是由万维网基金会(World Wide Web-Foundation)和英国开放数据研究院(Open Data Institute)联合开发的,旨在揭示全球开放数据计划在全球范围内的散播及其影响。2013年10月它们发布了第一份《全球开放数据报告》,截至2020年初共发布了五份全球评估报告,每一份完整的ODB版本的研究时间都是从7月开始到次年的6月共经历12个月。
作为国际政府数据开放评估体系之一,开放数据晴雨表分析全球数据开放趋势,提供国家及地区对比数据,致力于评估开放数据的全球发展情况。自2013年发布第一份报告以来,开放数据晴雨表的评估范围不断扩大,2013年对77个国家和地区进行了评估,2015年对92个国家和地区进行了评估,2016年对115个国家和地区进行了评估。2018年9月,万维网基金会发布了《开放数据晴雨表(领先者版本)》,也是2013年10月《开放数据晴雨表(第一版)》发布以来的第五版,与之前各版本的《开放数据晴雨表》报告相比,《开放数据晴雨表(领先者版本)》重点评估了30个在开放数据领域较为领先的政府在政府数据开放发展方面的情况,这30个政府有的采纳了《开放数据宪章》,有的签署了G20反腐败开放数据原则,该版本通过衡量它们的进展来检验其领导者地位。《开放数据晴雨表(领先者版本)》与以前版本的整体结果进行比较,总结回顾了全球各国政府过去十多年中在开放政府数据方面的表现。
开放数据晴雨表主要从准备度(Readiness)、执行度(Implementation)、影响力(Emerging Impact)三个方面对各国的政府数据开放实践进行评估。其中,准备度是指各国各地区开放数据所需具备的各方面条件,对政府政策、政府行动、公司和企业以及公民和社会团体14个评估关键因素进行具体评估(见图6-1);执行度是指各国各地区开放数据的执行情况,包括创新型数据集、社会政策数据集和问责型数据集,下分为15个具体的评估数据集(见图6-2);影响力是指开放数据对于商业、政治和社会组织带来的影响,由6个评估问题组成(见图6-3)。
图6-1 开放数据晴雨表准备度指标
其中,准备度与影响力的各项子指标以评估问题的形式组成,评估问题是指标中的最小评估层级。而执行度中,评估数据集的评估问题是固定的,共10个评估问题,即每个数据集均考察这10个评估问题,包括数据是否存在、在线获取、机读格式、数据整体可用、免费获取、开放许可、更新、数据集报告连续性、数据集信息获取简易性、数据关键元素的链接提供10个方面。
图6-2 开放数据晴雨表执行度指标
图6-3 开放数据晴雨表影响力指标
三项指标从前期的准备到中期的执行到后期的影响,贯穿了政府数据开放的各个阶段,对应的各项子指标深入政府数据开放的各个方面,使开放数据晴雨表成为最具影响力的国际评估体系之一。随着晴雨表工作组不断改进开放数据评估指标,开放数据晴雨表也在版本的迭代过程中不断探索更广泛的评估方法,在已有的五次评估中,部分评估指标有相应的增加和细化,体现了开放数据晴雨表的不断完善,以及全球政府数据开放评估的与时俱进。
开放数据晴雨表作为各个国家在开放数据进展方面的权威基准,现已被全球越来越多的拥护者和决策者所采用以衡量其开放数据现状,并设定针对性的改进目标来提升开放数据能力。开放数据晴雨表成为全球开放数据议程中越来越有影响力的工具,正在帮助人们更多地了解开放数据的政策和实践。例如,开放数据宪章使用晴雨表的分析来推动战略决策;20国集团反腐败工作组在其开放数据意见书中使用了晴雨表,以评估20国集团成员国的状况;欧盟委员会将晴雨表纳入其“欧洲数据门户网站”电子学习计划中,以比较各个国家的进展。此外,晴雨表还经常被各国研究人员用作二次研究的基础。
第二节 全球开放数据指数
全球开放数据指数(Global Open Data Index,简称GODI)是由开放知识基金会发起,根据开放知识基金会的“开放定义”设计的衡量全球各国和地区数据开放情况的一套评估标准。GODI主要评估数据集,通过抽样、问卷调查和访谈等方式进行,旨在为每个关键数据集设置数据采集和发布的标准,推动各国和地区利用此标准进一步开放数据,进而挖掘和释放数据潜能。GODI于2013年10月首次发布,报告对60个国家和地区进行了评估,之后每年发布一次评估报告。2014年评估范围已增加到97个国家和地区,包含了许多拉美、非洲和亚洲国家。2015年评估范围则增加到122个国家和地区。在2013年和2014年两期报告中,GODI评估了国家统计、政府预算、立法草案、选举结果、国家地图、空气质量、地理位置、政府开支、公司注册9个数据领域。相较于前几年,2015年GODI新增了招标采购、天气预报、水质和土地所有权4个数据领域。2016年,GODI又新增了行政边界和国家法律两个数据领域。同时,每一个数据领域都细化到具体的数据指标,并通过数据集存在与否、开放许可、可机读、免费获取、量级获取、更新、在线获取、数据格式、公共获取等评估标准来赋值,最后加权平均算出每个国家和地区的指数。整个评估一共有四个步骤:首先由志愿者对数据集进行评估,然后由本地协调员进行审查,接着通过专家评审员进行主题评审,最后在正式发布前进行大众评审。GODI的评估是采用非概率抽样方法,从公民角度开展针对各国关键数据集开放的独立评估,这就导致遍布世界各地的专家和志愿者提交的问卷调查和会议访谈将直接影响到具体的开放数据指数。当然,评估结果是经过同行评议和专家评审之后最终发布的。
在评估内容方面,GODI从2013年到现在,明确界定了国家统计、政府预算、政府支出、立法草案、选举结果、空气质量、公司注册、地理位置、招标采购、水质、天气预报、土地所有权、国家地图、行政边界、国家法律15个关键数据集,并提出9个问题对每个数据集进行评估,着重考察其在法律、技术或实践上的“开放性”。在权重计算中,为开放许可证/公共领域状态以及机器可读和开放文件格式等问题总计提供了40分,为有关数据可访问性的问题提供总得分最高为60分,所涉及的具体问题分别有不同的加权分值。GODI重点评估的15个关键数据集如表6-1所示。
表6-1 GODI重点评估的15个关键数据集
表6-1 GODI重点评估的15个关键数据集-续表
随着全球数据开放活动的不断扩展,全球开放数据指数已经被越来越多的国家政府作为考核开放数据项目实施情况的关键绩效指标。GODI设定的数据发布标准也已成为有关社会组织、研究机构用于推动政府进一步完善数据采集、发布和开放的重要工具。
第三节 联合国电子政务调查
联合国电子政务调查(UN E-Government Survey)是由联合国经济和社会事务部发起的。自2014年起,《联合国电子政务调查报告》将开放政府数据纳入评估范围并指出“开放政府数据能从根本上提高资源的使用率,改善公共服务”。在“只要不牵涉存在争议的隐私问题以及国家安全问题,所有政府数据都可以开放”的假设下,评估员首先查找各政府网站上的数据集,按领域对数据集进行分类,同时对政府数据使用便捷性等指标进行评估,例如专门的数据门户、数据使用说明、数据格式等。除此之外,该报告还关注开放政府数据的政策、法规、制度、标准等,调查各个国家是否通过立法的方式保护个人隐私和国家安全机密,以及开放数据的目录形式等,主要考察指标如表6-2所示。该报告主要采用带有结构化调查的桌面研究,对政府门户网站采用定量数据观测方法,平均每两年发布一次调查报告,截至2018年,全球已有139个国家和地区提供了政府数据开放平台或目录,与2014年46个国家和地区提供数据目录相比,体现出政府数据开放受到各国的重视程度越来越高。
表6-2 联合国开放数据评估的主要考察指标
表6-2 联合国开放数据评估的主要考察指标-续表
《联合国电子政务调查报告》是一个在全球具有重要影响力的评估项目,不仅可对全球各国政府的政府数据开放实践进行整体性评估,同时也将政府数据开放与可持续发展目标有机结合起来,为各国政府数据开放的深入发展提供一个可持续性的愿景。
第四节 开放政府数据指数
开放政府数据指数(Open Government Data Index,简称OGD指数)是由世界经济合作组织(简称世界经合组织)于2014年发起的,面向30个世界经合组织成员国开放政府数据情况的大规模调查评估。OGD指数主要采用调查问卷的形式对各国中央/联邦政府的首席数据官(CIO)进行调查。
为客观反映真实情况,监督和评价各国开放政府数据的执行,世界经合组织综合利用各种统计工具并开发了包含不同权重指标体系的开放政府数据指数框架体系。OGD指数主要从数据可用性、数据可访问性和数据再利用性三个维度评估政府在国际上开放数据方面达成协议的一些原则的实施上所做的努力。其中,数据可用性主要评估公共部门提供数据范围;数据可访问性主要评估数据的使用性,例如,元数据完整性、数据可机器读取性等;数据再利用性主要考察政府在促进数据创新性再利用以及利益相关者参与方面的支持,如创新活动的组织、数据宣传推广等。三个评估维度共有20个评估指标,其中数据可用性5个,数据可访问性6个,数据再利用性9个,每个评估维度权重各占1/3,具体评估指标满分均为1分。具体评估指标体系如表6-3所示。
表6-3 开放政府数据指数指标体系
在调查中,有30个世界经合组织成员国家回应了调查,其中25个国家在中央/联邦政府层面有专门的综合性战略,绝大多数已经开发了国家开放数据门户网站。各国中央/联邦政府对开放政府数据的支持主要体现在对战略/基础设施、定期协商、数据再利用活动的支持与促进以及促进国家门户网站数据可访问性等方面。世界经合组织正在进一步丰富和扩大开放政府数据指数的框架体系,并创建其他指标来帮助人们认识开放政府数据的所有潜在效益,例如促进经济发展、推动民主参与以及社会治理等。
第五节 中国开放数林指数
“中国开放数林指数”由复旦大学数字与移动治理实验室出品,是国内第一个针对地方公共数据开放水平的专业指数,自2017年5月起首次在贵阳数博会发布以来,每年定期对我国地方公共数据开放进行综合评价,以助推我国公共数据开放生态体系的建设与发展。自2018年以来,“中国开放数林指数”为国家互联网信息办公室信息化发展局监测我国公共数据开放情况提供数据支撑。2018年4月,“中国开放数林指数”被国家信息中心数字中国研究院发布的数字中国发展指数采纳,作为评估地区数据开放能力的依据。2019年5月,中国开放数林指数报告被收录为复旦智库报告系列,成为复旦大学每年重点推出的有社会影响力的报告之一。
复旦大学数字与移动治理实验室邀请国内外学、政、产各界共70余位专家共同参与,成立“中国开放数林指数”评估专家委员会,基于数据开放的基本原则,借鉴国际数据开放评估报告指标体系研究的经验,立足我国政府数据开放的政策要求与实践现状,构建起一个系统、科学、可操作的评估指标体系,并根据该体系采集分析数据、制作指数报告、提出对策建议。2019年最新的开放数林指数评估指标体系共包括准备度、平台层、数据层、利用层四个维度。
准备度是数据开放的基础,是数据开放工作的事前准备程度,主要包括法规与政策、组织与执行、标准规范等三个一级指标,具体评估指标如表6-4所示。
平台层是数据开放的载体,是连接数据开放供给侧和需求侧的桥梁,也是展示利用成果的中心,包括数据发现、数据获取、工具提供、利用成果、互动反馈、公众传播和账户体验等七个一级指标,具体评估指标如表6-5所示。
表6-4 中国开放数林指数指标体系-准备度指标
数据层是数据开放的核心,包括数据数量、数据质量、数据标准、数据覆盖面、数据持续性等五个一级指标,具体评估指标如表6-6所示。
表6-5 中国开放数林指数指标体系-平台层指标
表6-6 中国开放数林指数指标体系-数据层指标
利用层是数据开放的成果,旨在促进公共数据开放后的社会化利用,包括利用促进、成果产出和数据利用等三个一级指标,具体评估指标如表6-7所示。
表6-7 中国开放数林指数指标体系-利用层指标
中国开放数林指数评估维度和具体指标权重坚持总体稳定、动态调整的原则,随着时间的变化及各地数据开放进展变化不断优化。自2017年发布第一期中国开放数林指数以来,截至2020年1月,复旦大学数字与移动治理实验室共发布了五期中国开放数林指数,每期开放数林评估维度权重变化如图6-4所示。
图6-4 中国开放数林指数评估维度权重变化趋势