10月22日,由上海市经济和信息化委员会、上海市静安区人民政府、上海市大数据中心指导,上海市北高新(集团)有限公司主办的2020上海静安国际大数据论坛在上海市静安区市北高新商务中心隆重举行。作为大会的重磅环节,论坛上首次发布了《2020长三角政府数据开放一体化报告》。《2020长三角政府数据开放一体化报告》是“中国开放数林指数”系列报告发布的首个区域性报告。长三角地区作为我国经济发展最活跃、开放程度最高、创新能力最强的区域之一,在国家现代化建设大局和全方位开放格局中具有举足轻重的战略地位。在长三角地区深入推进政府数据开放一体化,有利于打造数字长三角,促进数据要素的跨域流动和融合利用,推动长三角数字经济和数字社会的一体化高质量发展。复旦大学数字与移动治理实验室主任、国际关系与公共事务学院教授郑磊带来报告解读。复旦大学数字与移动治理实验室主任、国际关系与公共事务学院教授郑磊《长三角政府数据开放一体化报告》:聚焦数据新要素与长三角一体化大家上午好,很荣幸在上海静安国际大数据论坛发布《长三角政府数据开放一体化报告》,这也是我们第一次发布长三角的报告。为什么在发布了全国的数据开放报告之外,我们还要专门发布一个长三角的数据开放一体化的报告呢?一方面是因为数据资源的重要性,特别是今年四月,中共中央、国务院发布重磅意见,将数据作为新型生产要素写入文件,并提出了要开放企业登记、交通运输、气象等公共数据,以及促进数据资源的流动。同时,国家已把长三角区域一体化上升为国家战略,所以我们把数据新要素和长三角一体化这两个主题放在一起做了这个报告。长三角地区是我国地方政府数据开放实践的重要发源地
首先我们来看目前长三角地区数据开放的情况。长三角地区是我国地方政府数据开放实践的重要发源地,在2012年6月份,上海市推出了全国第一个地方政府数据开放平台;2014年,无锡市上线了长三角第一个、全国第二个地级的政府数据开放平台;到2015年,浙江省上线了全国第一个省域政府数据开放平台。大家可以看到2018年之后,各地政府数据开放平台的上线速度进一步快速增长,到2020年9月份,长三角地区已经有32个地级以上包括副省级的地方政府数据开放平台。评估指标体系:聚焦准备度、平台层、数据层、利用层,四维综合评价目前这32个数据开放平台,它们分别是什么情况呢?首先我们从准备度、平台层、数据层、利用层四个维度来比较这些地方。其中,准备度是“数根”,是数据开放的基础;平台层是“数干”,是数据开放的枢纽;数据层是“数叶”,是数据开放的核心;利用层是“数果”,是数据开放的成效。我们把每个地方开放数据的情况,比喻成一棵“数木”。首先看它的数根,包括政策法规、领导重视、标准规范、执行力度。在数根的基础上,我们再看它的平台建设情况,平台层是指开放平台本身的用户体验如何,是否便于搜索、下载、使用这个政府开放的数据。其次,最关键的权重在数据层上,占比40%。它指的是:在这个平台上有多少数据的干货,包括数据的质量、数据的覆盖面,数据的标准等。最后我们还要看这些数据有没有开花结果,也就是说政府开放的数据,社会有没有对它们进行充分的利用,产生了各种数据可视化的产品、APP应用等,最后带来了社会和经济价值。所以从这四个层面看,长三角各个地区本身数木生长情况如何呢?从省级来说,目前领先的地区是浙江和上海。在准备度和平台层上,上海不仅领先长三角地区,而且在全国也处于领先位置。在数据层和利用层上,浙江在全国处于领先地位。大家可以看到长三角地区目前在整个国家的地方政府数据开放当中的地位。之后是江苏,安徽的平台还没有上线。我们也期待着长三角四个地方的省级平台都能上线。我们看一下地级(含副省级)地方的指数排名,目前领先的是三个地方:宁波,绍兴,温州,之后是泰州,衢州,无锡,金华等。我们看一下地理分布,颜色越深的地方,相对目前做得最好的地方,也就是数木从数根一直到数果最茂盛的地方,大家可以发现主要集中在浙江的东部跟南部,浙江整体的水平比较好;然后是江苏的南部,比如宁波,绍兴,温州;然后是江苏的南部,比如像无锡这样的地方;然后苏中,苏北地区的连云港也不错。往安徽这边,就稍微相对弱一点。但是和三年前相比,那时的数据开放情况还要弱很多,我们已经看到它在一点点扩散进步的过程。所以我们期待一两年之后会有更多的地方上线更好的数据开放平台。更重要的是,本次报告和全国总体情况的报告不同,《长三角政府数据开放一体化报告》不仅仅看每一个地方的情况如何,更要看一体化的情况,也就是这些平台之间有没有形成协同。
在法规政策的协同度上,我们会看各地是否已经制订了专门针对数据开放或者是公共数据管理,或者是公共数据共享开放相关的管理办法、以地方规章或者是规范性文件的形式。目前,长三角专门针对数据开放的管理办法只有三个地方:最早的是上海,在2019年8月29日出台全国第一个针对公共数据开放的管理办法;之后是浙江,在今年六月份出台了浙江省公共数据开放和安全管理暂行办法;江苏省连云港也有这样一个办法。其他地方是把开放跟共享放在一起,或者和公共数据管理放在一起制定。此外,浙江和上海还有专门关于公共数据开放的技术和标准规范。但目前的问题是各地有关于本地的数据开放管理办法,但还没有形成一个长三角地区的数据开放协同的专门文件或相关政策。所以我们认为在政策协同度上,现在还有进一步提升的空间。
在开放平台的连接性上,我们发现各个地方的平台都做的不错,但平台之间还没有互相关联,也没有深一步的长三角一体化的数据开放协同,这也是下一步的发展空间。在数据集主题的重合度和内容的匹配度上,我们发现有些数据集在有的地方开放了,在有的地方没有开放。我们看了14个常见数据集,就是各地都开放的一些通用数据集。可以看到,这14个里面,有一些上海开放了,有一些浙江开放了。我们再看某一个数据集,比较它的字段的匹配度,把这个数据集打开以后,比如“许可范围”这个字段浙江有,上海没有,但是“税务登记号”上海有,浙江没有。对数据利用者来说,如果想把上海和浙江的数据放在放在一起做一个应用,这个你有,这个他没有,他就没法协同利用起来。
所以我们打开一个个数据集,看看字段是否进一步匹配,这样对于数据利用者,能产生数据跨地区、跨省的数据协同的视角,这方面我们发现还有很大的空间。比如“食品生产经营抽检”这个数据集,有一个浙江有、上海没有,但是上海有的、浙江没有。非常好的是有一些两边都有,这就有协同的可能性。但是比较遗憾,江苏和安徽还没有出现这样的数据集。元数据是关于数据的数据,看看你把这个数据集放出来以后,有没有关于这个数据集背景的信息,比如它的名称,摘要简介,关键字、数据主题、提供单位、格式、开放类型等。在元数据标准的一致性上,我们看到,除了有一个数据浙江有、上海还没有,上海和浙江的一致性还是比较强的。但是安徽和江苏还没有开放出来。为什么要看这些,主要是为了从数据利用者的角度去判断能否能把各个地方的数据协同起来进行利用。在数据利用的跨域性上,各地都已经举办了很多的比赛。例如,每年举办的上海开放数据创新应用大赛,到现在已经有六年了。浙江和江苏今年也办了比赛,但是我们还没有看到长三角各个地方真正协同起来的比赛,或者是看四个省市的地级市区之间有没有联动比赛。目前各个地方还是各做各的,还未出现真正的联动型比赛。但是参赛者里面有联动,上海赛区有浙江、江苏的参赛者,浙江赛区有外地的参赛者。未来是不是有可能变成一个协同的比赛?这是我们要考虑的。从数据的利用成果来看,目前在这些大赛的成果里面,我们还没有看到哪一个大赛的成果能够用到各个地方的数据,当然我们不能怪这些数据利用者,主要是因为有些地方的数据有的没有开放,供给跟不上,利用当然也跟不上。所以,我们期待各个地方的开放数木,从数根到数干,到数叶,到数果都能够枝繁叶茂、花开结果。过去三年,我们也不断看到了这些数木的成长。但是,从长三角一体化的视角来看,我们期待这些数木不仅枝繁叶茂、开花结果,同时还能够根系相通,枝叶相连,在数叶的匹配度一致性,以及数果的相联性上面进一步推进,使它们都能够联动起来,这样才能形成一片繁盛多样、又协同一体的长三角开放数林。非常感谢上海市静安区对于《长三角政府数据开放一体化报告》和“数据新要素与长三角一体化”论坛的支持,我们也期待未来能够继续在静安发布以后的报告。谢谢!