关键词:政府开放数据;开放数据平台;开放数据政策;数据资源
摘要:[目的/意义]从整体视角探索我国政府开放数据资源建设情况有助于厘清现有的实践进展及问题,从而更好实现开放数据在政治、经济、文化等方面的价值,推进相关理论与方法的发展。 [方法/过程]基于从国家到地方的开放数据政策及平台的整体调研可发现我国开放数据资源建设的准备度、实施度以及成效度均在持续提升中,但在统筹规划、数据资源以及平台的建设方面仍不够充分。 [结果/结论]我国开放数据资源建设尚需从以下方面予以优化:基于整体布局国家开放数据资源建设、多层次逐级完善开放数据资源、面向国家数据中心推进开放数据平台共建。
往期推文中,我们为大家推出了多个主题的中心研究员成果(公众号主页菜单栏“学术动态—研究员成果”中可查看)。本期继续为大家推出是“数字政府/政府数据管理”专题,相关成果有以下4篇:
● 周文泓等 《我国政府开放数据资源建设进展、问题与对策研究》(本文)
● 毕建新等 《在线政务服务视角的电子文件管理对策研究——基于<国务院关于在线政务服务的若干规定>的分析》
● 梁绍红等 《<浙江省党政机关电子公文归档与电子档案管理暂行办法>解读》
本期分享的论文来自周文泓等《我国政府开放数据资源建设进展、问题与对策研究》。
我国政府开放数据资源建设进展、问题与对策研究
周文泓,夏俊英
摘要:[目的/意义]从整体视角探索我国政府开放数据资源建设情况有助于厘清现有的实践进展及问题,从而更好实现开放数据在政治、经济、文化等方面的价值,推进相关理论与方法的发展。[方法/过程]基于从国家到地方的开放数据政策及平台的整体调研可发现我国开放数据资源建设的准备度、实施度以及成效度均在持续提升中,但在统筹规划、数据资源以及平台的建设方面仍不够充分。[结果/结论]我国开放数据资源建设尚需从以下方面予以优化:基于整体布局国家开放数据资源建设、多层次逐级完善开放数据资源、面向国家数据中心推进开放数据平台共建。
关键词:政府开放数据;开放数据平台;开放数据政策;数据资源
引文格式:周文泓,夏俊英.我国政府开放数据资源建设进展、问题与对策研究[J].情报理论与实践,2019,42(3):43-48.
中图分类号:G250.73
开放数据资源建设实施度主要是从开放数据平台建设的层面,从数据共享和促进数据的利用两个角度考察。但由于我国尚未有国家级的开放数据平台上线,故评估样本为我国已上线的23个左右的地方政府开放数据门户:北京、广东、贵州、江西、宁夏、山东、上海、浙江、广州、深圳、哈尔滨、成都、济南、青岛、东莞、佛山、梅州、湛江、肇庆、贵阳、长沙、苏州、无锡。2018年4月1日至2018年5月8日,笔者依据上述的评估框架收集数据,结果如下:
2.2.1 数据可获取性
各层级的开放数据平台能提供基本的数据下载链接和检索栏,但在获取方式上缺乏多样化的检索方式和排序方式,影响用户获取数据的效率。从整体看,所有的平台均能提供下载链接,95.7%的平台能提供检索栏,30.4%的平台能提供除主题和机构外的其他类型的检索方式,60.9%的平台能按照更新时间、下载量、访问量等对数据进行排序。
2.2.2 数据多元性
首先,在数据资源的数量方面,我国政府已有一定数量的开放数据上线,并且各地的开放数据资源仍在持续增长。23个平台共开放43663个数据资源,各平台平均开放1948个数据资源。其次,在数据资源的主题方面,整体上开放的数据集涵盖的数据主题较为充分,但具体到各平台的层面,则存在数据主题开放不够充分的问题。例如,仅有3个平台开放法律服务的相关数据。第三,在开放数据的机构方面,23个地方开放的数据来自44类部门,基本涵盖了绝大部分的政府部门,但各类型的开放机构在各个平台上是否开放数据仍存在较大的差异性。8类开放机构相应的平台数量≥20,31类开放机构相应的平台数量≥10且<20,5类开放机构相应的平台数量<10。
2.2.3 数据更新及时性
从整体来看,平台上的大量数据集的数据更新不及时。由于需要平台的发布时间、更新时间、更新频率等与时间有关的元数据以作比对,故仅有10个平台满足调研条件。调查发现这10个平台中58.00%的数据集实际未更新,42.00%的数据集实际进行了更新,且更新的数据集中大多是以年为单位进行更新。
2.2.4 数据可用性
第一,在数据文件的格式上,开放的数据格式数量不够充足。对除江西(无数据格式相关说明)外的其余22个平台展开调查,发现59.51%的数据文件是以开放的格式提供,40.49%的数据文件是以非开放的格式提供。
第二,在开放数据的形式上,数据集是最为普遍的开放形式,但数据接口和数据应用的开放程度不足。23个平台开放了22991个数据集,17个平台开放了20365个数据接口,17个平台开放了297个数据应用。
第三,各平台上的数据资源,用户均可自行下载利用,但并未实现所有平台的资源对用户均免授权的状态。目前,用户不需要注册或登录等方式即可直接下载数据资源的平台共有9个。
第四,大多数平台缺少专门的数据开放许可协议,而是在各平台的服务协议或免责声明中提及用户有权免费获取网站资源,且对用户的许可尚未全面铺开。目前,17个平台有数据开放共享许可相关协议条款。
2.2.5 数据非歧视性
绝大部分的数据集是无条件开放的,用户对其拥有相等的权利,能满足非歧视性的相关要求。但也有少量数据集属于定向开放的数据集:北京的开放数据平台上无条件开放了754个数据集,面向研究生智慧城市大赛参赛者开放了64个数据集,不满足非歧视性的数据集占比7.8%。
2.2.6 平台知识性支持
首先,平台上的信息公开程度不足。共有4个平台公开了72条信息,66.67%的信息能提供附件下载但不能在线浏览,33.33%的信息能在线浏览但不提供下载链接。从公开的信息内容来看,主要为各地的开放数据政策法规、规划、计划以及各部门的开放数据清单。其次,平台上有关开放数据的知识数量较少,且内容单一。11个平台提供了开放数据的相关知识,按知识内容主要分为三类:一是提供开发者文档,这也是平台知识普及的最普遍的一类;二是提供API接口的使用说明书;三是提供开放数据的一些行业动态,主要是向用户普及开放数据的实践现状。
2.2.7 平台社区性支持
首先,平台上向用户提供的交流论坛数量少,且论坛活跃度低,未达到用户相互交流的目的。目前只有两个省级开放数据平台开设了供用户交流的论坛,共有29条帖子、15817次浏览及9条回复,其中6条均为系统管理员在当天的回帖。其次,平台的社交媒体模块建设不完善。目前仅有两个平台设置了微信公众号,一是政务网站的微信号,但微信号中仍仅有信息公开版块,缺少数据开放版块;二是政府开放数据的微信号,但微信号仅提供开放数据的相关信息推送。
2.2.8 平台互动性支持
第一,平台对于用户自主开发的APP提供的共享通道不足。目前有12个平台为用户开发的APP提供共享通道,11个平台的共享通道为网页在线提交,1个平台的共享通道为发送邮件。
第二,大部分平台设有意见征集版块,平台回复较为及时,但对用户意见的重视度不够,缺少对用户意见的公示及进一步深度挖掘。目前共有14个平台提供意见征集版块。但仅有两个平台将用户的意见及网站回复在平台上予以公开,平台均在当天或第二天予以回复。
第三,平台的数据申请功能较为完善。目前有12个平台提供数据申请功能,均为用户在线填写所需的数据类型、数据格式、数据提供方等详细信息后即可即时提交,但仅有两个平台对用户的数据需求予以公示。
2.3 开放数据资源建设成效度
2.3.1 社会关注度
从数据资源的下载量看,开放数据的价值已经得到了社会与公众的关注与认可。23个平台共计22991个数据集累计下载次数达到1926324次。对能对数据集下载量进行排序的16个平台下载量前三的数据集进行主题汇总,发现公众对于民生服务和教育科技类的数据集的关注度较高,对地理空间、法律服务、食购游娱、宗教信仰类的数据关注度较低。
2.3.2 数据应用情况
在数据应用方面,已有一定的数据应用开放,但应用的主题较为集中,不够多元。17个平台共开放了297个应用,对这297个数据应用进行进一步调研,发现数据应用场景较为单一,主要集中在交通运输、民生服务及食购游娱领域。
2.3.3 开放数据资源利用成效
首先,我国政府开放数据已经在政治、经济、社会等方面显现出一定的影响。在政治上,公众通过目前已经公开的政府预算,招投标数据等,对政府的各类行为进行验证,减少腐败滋生。在经济上,开放数据可以促进大众创业和高科技创新,通过政府与企业数据的彼此开放和对接,在医疗、交通、民政等领域涌现出一批新业务、新企业。在社会上,主要是通过对环境数据的开放,加强治污力度,提升环境可持续性。其次,用户反馈的内容主要分为两种,一种是用户的数据需求反馈,另一种是对平台的直观体验。目前仅有两个平台将用户的反馈进行公示,共有12条用户反馈。
3.2 开放数据资源的建设不充分
第一,数据资源的数量有限。一方面是部分平台的数据资源数量较少,相比庞大的政务数据资源数量,其开放数据的数量明显不足。另一方面是尽管部分平台已开放了一定数量的数据集,但数据接口、数据应用等形式的数据资源数量明显不足。
第二,数据资源的质量待优化。①数据资源涵盖的主题及其发布机构多元性不足。多元化的数据资源是数据集群、关联、开发的重要特质。但部分主题开放的平台及数量较少,例如地理空间、法律服务等方面的数据。从数据资源的发布机构看,一方面部分部门发布的数据资源数量少,例如海关部门、信访部门等;另一方面部分政府职能部门尚未开放数据,例如移民部门、应急管理部门等。②数据资源开放不及时。开放数据的原则要求数据一旦生成应尽快开放,但平台上实质仍有大量的数据集未更新。
第三,数据资源的开放程度不足。①数据的开放授权不足。一方面是国家层面尚未出台数据开放授权协议,地方层面也更多是的在各平台的相关协议中提及数据开放授权的相关条款。而条款中有关用户权利的相关申明和用词用语较为模糊,更多的条款是有关用户的责任及平台的免责申明,难以有效保障用户的权益。另一方面是由于政策层面对用户的权益保障不足,导致在实际的数据获取和利用方面,用户面临种种的障碍,难以实现开放数据对用户免授权的原则。②平台现有的数据资源没有达到开放数据的原则要求,开放等级较低。根据T.Berners-Lee提出的数据开放五星等级看我国的数据开放等级,发现目前我国40.49%的数据集的开放等级为二星,59.22%的数据集的开放等级为三星。
3.3 开放数据的平台建设待深化
第一,开放数据平台集成度不足。国家级的开放数据平台建设尚未上线,用户难以一站式的浏览、获取和利用跨地方、跨层级、跨系统的政府开放数据。而各地方平台建设也没有以国家开放数据平台的建设为导向建设平台,导致各层级平台的集成度不足。一方面大部分的平台仅包含某一层级、某一地方及部分系统的数据资源。另一方面虽有少量的平台集成了下级市区的开放数据资源及平台,例如广东、山东、贵阳等地,但数据平台的集成是以省级或市级的开放数据平台建设为导向,未充分借鉴国内政策和国外经验以协同共建的方式完善平台建设,导致各地方的数据共享及平台互通难以实现。
第二,开放数据平台的功能有限。①平台上的数据资源呈现方式待完善,大部分的平台仅能做到数据可获取,而并未从用户的角度出发提供便于检索和浏览的多样化的获取方式。②平台有关开放数据的信息及知识提供不足。一方面大部分平台尚未建设信息及知识提供的功能模块;另一方面即使部分平台设有信息及知识提供模块,但信息及知识更新慢、数量有限、内容单一,难以吸引用户的关注从而增进用户对开放数据的兴趣和了解。③平台互动性的功能模块建设不足。一是现有的政府与用户之间更多的是从用户到政府的单向信息流,政府被动进行反馈,缺乏政府到用户主动信息流,例如主动向订阅用户发布平台新数据集的简介,主动征集用户开发开放数据的工具等。二是平台上有关社交媒体和论坛的模块中基本上仍然为政府与用户的互动,尚未达成用户与用户之间的互动。
第三,具体规划要做好国家与地方间的统筹以及平衡。一方面,国家开放数据资源体系建设需要各地方与各专业系统的充分参与和投入,这意味着需要在统一的框架内开展工作,从而能够实现数据的互联互通互信互用,并形成更加完整的数据资源供社会挖掘利用。因而,在开放数据的进展上应当从宏观目标还是具体事项上需要相对统一的标准与要求。另一方面,考虑到各地开放数据当前水平不一,且各地整体发展水平有一定差异。在明确各地应当有积极的开放数据意识的前提下,也需要根据各地具体情况来定位其在国家开放数据资源体系建设中的任务。
4.2 多层次逐级完善开放数据资源
数据资源是整个开放体系中的核心资产,为了实现真正的开放以满足开放数据的本质属性,我国可从三方面逐级完善整体的数据资源:
第一,在国家政策规划以及各地相应的本地化政策的指导上做好政府内部数据的互通互联工作,为数据充分开放做好资源储备工作。一方面,明确政务信息资源共享的基本流程、具体要求以及注意事项,在前端做好数据的质量管控与认证工作;另一方面,从系统建设上实现数据共享整合,实现国务院各部门整合后的政务信息系统接入国家数据共享交换平台,各地区结合实际统筹推进本地区政务信息系统整合共享工作,实现数据互认共享,并建立动态更新的数据资源体系。
第二,提升数据的开放程度。一方面,完善政策制定,从数据共享导向进一步对外开放,当前的政策都主要立足于政府内部的数据共享,尚需针对开放数据制定专门的政策,从而确保各责任主体能够有意识、有计划、有指导地完成相应的开放数据工作。另一方面,依照开放数据的原则以及质量要求形成、共享、整合与开放数据资源。这涉及明确数据开放的每一项流程及其具体要求,例如数据目录规范、数据元数据方案或是描述方式应当参照国际的相关标准,数据开放前应当要有质量审查环节等。同时,亦要对数据资源本身有相应要求,应满足开放数据的八大原则,当前主要做到提升开放数据尤其是高价值数据的数量、数据覆盖更多领域的需求、以开放格式发布等,更要确保发布的数据在整个生命周期中都能得到真实、完整、安全、有效的维护。
第三,开放数据资源应以最大程度得到利用为目标予以完善。一方面,可在形式上优化开放数据的呈现,除了以原始数据和API的方式来发布数据,亦可以通过APP应用的方式示范数据的价值和利用方式。另一方面,加强开放数据的集成与可视化呈现,既要满足通过国家开放数据平台一站式服务获取所需在线数据的需求,亦可通过可视化如数据地图的方式提供数据利用。
4.3 面向国家数据中心建设目标推进开放数据平台共建
第一,从国家到地方要开展集成式的开放数据平台建设与上线。一方面,国家开放数据平台可与国家数据中心进行对接,并为地方开放数据平台的开发与升级提供功能以及技术架构,从而促进各地开放数据平台能同国家开放数据平台形成互通的网络。另一方面,各地应根据其具体情况展开开放数据平台建设,在国家尚未上线开放数据平台的情况下积极参照国内外的最佳实践以及现有的标准规范进行平台的设计、开发与建设。英国、美国等国以及上海、贵州等地的开放数据平台在资源呈现以及平台功能设计上均有可借鉴之处。同时,加强对标准规范的学习与应用,从而为跨地区、跨部门、跨层级的开放数据平台连通奠定基础。
第二,优化平台功能以提升数据的共享与应用。平台的本质是为数据发布者、管理者、用户等利益相关者提供活动尤其是互动中心。为促进对数据的认识与利用,平台功能当前需从如下方面优化:①在数据的呈现与获取上融入先进的检索与可视化技术,例如加强对数据的描述以促进数据的多维度发现。②增加更多互动模块以促成社区性互动中心的形成,促进发布者、管理者、用户之间多向度展开知识共享与多主体参与以深化数据的开放。③补足开放数据的知识与政策模块,无论是关于开放数据的内涵、进展、技能等业务与管理性知识都可通过平台得到充分的理解。④积极利用技术来升级平台,定期做好网站评估,应用前沿技术优化平台技术配置如数据管理系统以完善数据的发布、共享、检索和利用。
原文载《情报理论与实践》2019年第3期,
已获作者授权。
学生研究员学习感悟
参考文献
[6]吴钢,曾丽莹.国内外政府开放数据平台建设比较研究[J].情报资料工作,2016(6):75-79.
[7]刘文云,岳丽欣,马伍翠,苏庆收.政府数据开放保障机制在数据质量控制中的应用研究[J].情报理论与实践,2018(4):21-27.
[8]黄如花,林焱.国外开放政府数据描述规范的调查与分析[J].图书情报工作,2017(20):37-52.
[9]高国伟,龚掌立,李永先.基于自组织的政府开放数据资源分类模式[J].图书馆学研究,2017(23):31-35.
[10]武琳,黄颖茹.开放政府数据平台元数据标准研究进展[J].图书馆学研究,2017(6):14-21.
[11]谭必勇,陈艳.我国开放政府数据平台数据质量研究——以十省、市为研究对象[J].情报杂志,2017(11):99-105.
[12]李晓彤,翟军,郑贵福.我国地方政府开放数据的数据质量评价研究——以北京、广州和哈尔滨为例[J].情报杂志,2018(6):141-145.
[13]黄如花,刘龙.我国政府数据开放中的个人隐私保护问题与对策[J].图书馆,2017(10):1-5.
[14]复旦大学,提升政府治理能力大数据应用技术国家工程实验室.2018中国地方政府数据开放报告[EB/OL].[2018-07-24].http://www.dmg.fudan.e du.cn/?p=5359.
[15]郑磊,高丰.中国开放政府数据平台研究:框架、现状与建议[J].电子政务,2015(7):8-16.
[16]艾伯特·J·梅杰,迪尔德丽·科廷,马顿·希尔布兰德,李倩,周志忍.开放政府:连接“知情”与“建言”[J].国际行政科学评论(中文版),2013,78(1):10-27.