Skip to main content
SearchLoginLogin or Signup

[CN] UK-China Open Data Development and Collaboration

Published onMar 15, 2016
[CN] UK-China Open Data Development and Collaboration
·

关于本报告

《中英开放数据发展与合作》报告由中国工业设计研究院委托高丰博士编写,项目得到了英国联邦与外交事务部中国繁荣基金的资助。

本报告的所有观点均为作者本人所有,不代表委托方中国工业设计研究院及资助方英国联邦与外交事务部。

关于报告的任何事宜,请通过 [email protected] 联系

关于作者

高丰博士,独立开放数据咨询顾问,英国南安普敦大学计算机科学博士,北京邮电大学计算机科学与技术学士。

高丰自2013年起担任英国开放知识基金会(Open Knowledge)中国大使,于2014年发起开放数据中国(opendatachina.com),一直致力于开放数据领域的倡导、研究和创新。他已先后与英国开放知识基金会、世界银行、瑞士Lift、中国工业设计研究院、复旦大学等国内外机构开展合作。他也是开放数据指数和开放数据晴雨表的贡献者。

关于中国工业设计研究院

中国工业设计研究院是由中国工业设计协会和上海市经济和信息化委员会共同筹建,得到了国家工信部和上海市政府的支持。中国工业设计研究院承办了上海市开放数据创新应用大赛(SODA)并在大数据领域提供创新开发和应用的咨询服务。

前言

1.1 背景

Open Data,开放数据,是全球各国政府面临的新挑战和机遇。

在2014年由澳大利亚 Lateral Economics 所发布的《Open for Business:How Open Data Can Help Achieve G20 Growth Target》报告中就明确指出,开放数据将能够帮助G20国家在5年内实现1.1%的GDP增长,而单这一项带来的增长就已占到了G20国家5年GDP增长总目标的50%。

面对开放数据所能带来的巨大潜能,中国也正推动全国范围的数据开放。2015年9月,国务院办公厅发布了《促进大数据发展行动纲要》,设立了2018年上线国家级开放数据平台,2020年逐步实现交通、医疗、卫生、环境、气象、企业登记监管等领域数据向社会开放的目标。

然而,与宏大目标相对的,是当前中国开放数据实践欠佳的现实。根据国际第三方评估「开放数据晴雨表(Open Data Barometer)」2014年版的结论,中国的开放数据实践仅排名46位(共86个国家)。而由开放数据中国和复旦大学数字与移动治理实验室共同开展的「开放数据探显镜」也反映当前开放数据总量低,可机读性比例不高,数据多静态,且更新不及时的问题。同时,当前政策和管理机制的不完善,隐私保护法律的缺失,数据权属不清,数据交易和数据开放间的博弈,也都使得中国开放数据发展的前景不明。

面对如此巨大的挑战,中国或许可以从其他国家的经验教训中获得启示和帮助。英国作为连续两年夺得世界开放数据绩效第一的国家,在开放数据领域有其独到的方法和经验。由其国家财政支持的开放数据研究院(ODI)更是在世界范围内催化开放数据文化,孵化开放数据企业。

在这样的背景下,中国工业设计研究院和英国驻华使馆开展了中英开放数据交流的项目。该项目得到了英国外交和联邦事务部中国繁荣基金的资助,涵盖了三次交流互访:

  1. 1.

    邀请英国开放数据研究院前来上海与上海开放数据团队交流沟通,并作为评委出席上海开放数据创新应用大赛决赛。

  2. 2.

    邀请英国开放数据研究院前往北京,会同国家信息中心、国家行政学院交流开放数据的发展问题,并探讨可能合作方向。

  3. 3.

    由上海开放数据团队组团(2人)前往英国伦敦考察开放数据发展,拜访英国开放数据研究院、伦敦开放数据团队等。

项目期望通过这三次交流,建立起中英双方在开放数据上的合作基础,加深双方对各自在开放数据及相关应用领域上工作的了解,进一步推动上海开放数据的发展,加速成果转化和生态圈形成,并借助英国专家的经验,改善自身实践。同时,双方的交流也将确定一批可能的合作方向,在开放数据政策、开放数据项目实施、开放数据研究、开放数据商业等方向上加深双方的交流并促成实际的合作。

本报告也即在此背景下受中国工业设计研究院委托所写,希望能够对中英两国当前开放数据的整体情况和发展脉络予以一个简单明了的梳理,并基于此次中英交流项目开展的成果,展望未来中英两国在开放数据层面的可能合作。

1.2 方法

本报告中所指称的“开放数据”,采用了英国开放数据研究院(Open Data Institute)的定义,即开放数据是任何人可以自由获取、使用并且分享的数据。所谓“自由”,即指从技术层面而言,数据机器可读便于无技术限制使用,而从法律层面而言,则指数据授权在开放授权协议下,数据版权方不限制数据使用的目的和人群,以及不限制数据的再次传播。

同时,有鉴于目前中国开放数据发展的实际情况,在无特殊说明的情况下,本报告中所指的“开放数据”均为来自政府的开放数据。

本报告在编写过程中,采用桌面调研方式,查阅文献并梳理出报告中涉及中英两国开放数据发展的历程和现状,也囊括了本身由作者已完成的部分研究内容。而除此之外,本报告也借由2015年中英开放数据合作项目的渠道,对项目中涉及的中英两方人员进行了访谈和问卷调查。因此本报告中的部分内容和数据直接引自访谈和问卷结果,亦有部分内容由作者引自或总结自中英双方人员交流会议的会议记录。

中国开放数据发展概览

2.1 中国开放数据的发展动机

2015年8月30日发布的《促进大数据发展行动纲要》是中国第一个明确推动数据开放的国家层级政策文件。该文件中对中国政府开展数据开放的主要动因总结道:「推进数据资源向社会开放,增强政府公信力,引导社会发展,服务公众企业」,具体来看:

一是要通过数据开放进一步改革社会治理模式,提升公共服务模式,从而增强政府自身公信力。沿着这一路径,我们可以理解中国数据开放的将会进一步打造精准治理,促进政府监管和社会监督有机结合,有效调动社会力量参与社会治理的积极性,并通过数据的开放促进多方协作,形成共治共商的社会治理新模式。而从公共服务角度而言,数据开放可以进一步推动服务型政府的建设,用于构建以人为本、惠及全民的民生服务新体系。政府数据的开放将会充分调动市场力量,针对公用事业、市政管理、城乡环境、农村生活、健康医疗、减灾救灾、社会救助、养老服务、劳动就业、社会保障、文化教育、交通旅游、质量安全、消费维权、社区服务等领域提升服务的质量和覆盖能力。

二是要引导社会发展,建立运行平稳、安全高效的经济运行新机制。通过数据的开放,可以进一步提升信用、财政、金融、税收、农业、统计、进出口、资源环境、产品质量、企业登记监管等领域发展的透明性,实现社会对经济运行更为准确的监测、分析、预测、预警,提高决策的针对性、科学性和时效性,提升宏观调控以及产业发展、信用体系、市场监管等方面管理效能,保障供需平衡,促进经济平稳运行。

三是要开启大众创业、万众创新的创新驱动新格局。形成公共数据资源合理适度开放共享的法规制度和政策体系,通过率先开放信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等重要领域数据,带动社会公众开展大数据增值性、公益性开发和创新应用,充分释放数据红利,激发大众创业、万众创新活力。

2.2 中国开放数据的发展目标

《促进大数据发展行动纲要》将开放数据工程列为了十大关键工程之一,设定了如下目标:

一是要制定工作计划和发展标准。《纲要》明确指出,政府部门和事业单位等公共机构应梳理并发布数据资源清单,制定公共机构数据开放计划,落实数据开放和维护责任,从而统一汇聚公共数据资源,集中向社会开放。进一步而言,《纲要》也针对数据的标准提出了要求,指出应当提升提升政府数据的一致性和准确性,从而促进互联互通,提高共享能力。

二是要建设统一开放平台。《纲要》中明确设定了发展的时间节点,要求在2018年底前,建成国家政府数据统一开放平台,并在2020年底前,逐步实现信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放。

三是要改革数据采集形成机制,引导非政府单位的数据开放。《纲要》指出,应当建立政府和社会互动的大数据采集形成机制,强调大数据时代,政府非唯一数据源,应当积极寻求以数据为要素的政府机构和社会力量的合作,优势互补,建立数据采集到汇流的机制。而更进一步,在推动政府数据开放的同时,塑造全社会数据开放文化,引导非政府机构例如企业、行业协会、科研机构、社会组织等主动采集数据并开放数据。

2.3 国家层面现有开放数据计划

国家统计局

国家统计局在2013年上线了其重新改版的网站「国家数据」(data.stats.gov.cn),是国内第一个国家级公共机构推出的可自由下载、利用、传播数据的数据门户。

「国家数据」的数据内容涵盖了国家统计局职能范围内所采集汇总的各类统计数据,按照采集时间频度分为月度数据、季度数据、年度数据,按地域分为地区数据、部门数据和国际数据。平台除提供了数据下载之外,亦提供了数据的在线可视化和统计分析功能,便于使用者基于开放数据获取即时的洞见。

国家气象局

国家气象局所推出的「气象数据开放平台」面向开发者提供了2个API接口,一为普通气象接口,包含369个地级市的3天气象预报及三个气象指数(穿衣指数,舒适度指数,晨练指数),二为常规气象接口,包含国内全站2566个县级以上城市未来3天常规预报以及三个气象指数。

国家林业局

国家林业局的中国林业数据开放共享平台(data.forestry.gov.cn)于2016年上线,据相关新闻报道所称,其对国家林业局各司局各直属单位以及全国各级林业主管部门多年形成的各类数据成果资料、国内外各类公开的林业信息资源进行整合,同时开放数据上传平台,丰富各类林业数据,建成了中国林业数据开放共享平台。

国家农业部

国家农业部于2015年年底发布了《推进农业农村大数据发展的实施意见》,其中明确指出:

「推进数据共享开放。整合农业部数据资源,统一数据管理,实现数据共享。农业部各类统计报表、各类数据调查样本和调查结果、通过遥感等现代信息技术手段获取的数据、各类政府网站形成的文件资料、政府购买的商业性数据等在国家农业数据中心平台共享共用。通过项目资金安排带动数据资源整合,除国家规定保密的数据外,对不共享、不按规定开放数据的,严格控制安排相关项目资金。通过内部整合和外部交换,逐步推进部内司局之间、涉农部门之间、中央与地方之间数据共建共享。编制农业农村大数据资源开放目录清单,制定数据开放计划,推动各地区、各领域涉农数据逐步向社会开放,做到数据应开放尽开放,提高开放数据的可利用性。」

国家环保部

国家环保部于2016年发布了《生态环境大数据建设总体方案》,其中明确指出:

「推进生态环境数据开放。建立生态环境数据开放目录,制定数据开放计划,明确数据开放和维护责任。优先推动向社会开放大气、水、土壤、海洋等生态环境质量监测数据,区域、流域、行业等污染物排放数据,核与辐射、固体废物等风险源数据以及化学品对环境损害的风险评估数据,重要生态功能区、自然保护区、生物多样性保护优先区等自然生态数据,环境违法、处罚等监察执法数据。依托环境保护部政府网站建设生态环境数据开放平台,提高数据开放的规范性和权威性。」

2.4 地方层面现有开放数据计划

地方层面上,以上海、北京为代表的地方政府则从2011年起便陆续启动了自己的开放数据计划。截至到2015年年底,已至少有11个地方上线了开放数据门户。此外,亦有深圳、广东、威海、常德等地已经陆续启动了相应工作,只是正式的开放数据门户尚未上线。

从目前地方开放数据计划地域来看,目前普遍仍旧集中于沿海或长江流域地区。这些地方普遍有着较好的经济基础,较优秀的信息化底子,具备一定的资源和动力来开展相应工作。

地方政府开放数据计划

2.5 其他类型开放数据计划

上海图书馆开放数据平台

上海图书馆开放数据平台(data.library.sh.cn)于2016年上线,是目前中国第一个文化类非政府职能机构的数据开放平台。其所提供的数据为关联开放数据(Linked Open Data),以API形式对外开放。目前内容囊括中国历史纪年表、地理名词表和机构名录。

海航数据开放平台

海南航空公司旗下海航云科技技术研究院建设了海航数据开放平台(data.haihangyun.com),其有航空、旅游、物流、金融、商业等15个分类,以数据开放API为主要形式向社会进行数据开放。开放内容包括海航集团各成员企业可开放的各类数据,以及互联网其他数据开放平台上各企业组织网络免费数据开放资源,为企业和个人使用海航集团企业数据开展信息资源的社会化开发利用提供数据支撑。

北京大学开放研究数据服务平台

北京大学开放研究数据服务平台(opendata.pku.edu.cn)是由北京大学设立的旨在推进「开放科学」的科研数据开放平台。其目前囊括了北京大学中国调查数据资料库,北京大学可视化与可视分析研究组开放数据,北京大学生命科学学院生物信息学中心等跨学科的开放数据。

2.6 国际第三方评估

开放数据晴雨表 是由万维网基金会(Web Foundation)所启动的一项第三方独立评估。

评估方法

其评估针对国家级开放数据计划,从「准备度」、「关键数据」、「影响力」三个层面来评估每一个国家在开放数据上的进展。每一个国家的调研由一名研究人员独立完成,然后由一名审稿人审阅和研究主管复审。除此之外,晴雨表也联系各国家政府,期望由一名相应国家工作人员对所有调研问题进行回答,与研究人员的调研相结合,最后产出结果。

对于评估维度中的「准备度」而言,其主要考察了政府、社会团体、企业三个利益相关者对开放数据的准备程度。具体来说,对于政府,准备度意味着「是否有信息公开/隐私保护的法律」、「是否有国家层级的开放数据政策」、「地方政府是否开展开放数据计划」、「是否有竞赛等形式鼓励开放数据创新」;而对于社会团体和企业而言,则意味着「社会团体和企业是否积极参与开放数据的利用」、「是否有面向社会团体和企业的开放数据培训项目」等。

而对于「关键数据」,晴雨表则挑选了15个分别关于「政府公信力」、「社会发展」、「创新」的关键性数据集,评估该国家是否存在满足要求的数据,数据是否可机读,是否开放授权等。

最后从「影响力」角度来说,晴雨表要求基于已有的实证材料如媒体报道、论文等来评估该国家是否已经有因为开放数据而带来的「经济」、「政治」、「社会」的影响力。

评估结论

在2013年的开放数据晴雨表中,中国排位第61位(共77个国家),而在2014年的评估中,则上升了15位,位列第46位(共86个国家)。

从评估结果来看,中国排名上升,主要归功于2014年间,创业者和企业对开放数据的关注,且地方政府如上海、北京都先后开展了比赛来宣传开放数据并激励数据的创新使用。此外,2014年的评估中也体现了当前关键性数据集的开放性有所进步,且一些数据得到了一定程度的利用,有相关媒体报道了使用后所达成的初步影响力。

但从整体排名来说,中国尚处于中间位置,同西班牙、匈牙利、菲律宾等国家一样被归属于「正在崛起」的类别。此类别的特点是,虽在开放数据的进展中有所创新,结合本地特色开展工作,但仍旧面临诸多严峻的问题,例如体制机制的不完善,法律的缺失等。

而在从G20国家来看,中国的排名则仅仅优于沙特阿拉伯,排位第19。结合澳大利亚 Lateral Economics 所发布的《Open for Business:How Open Data Can Help Achieve G20 Growth Target》报告来看,中国若想要实现报告中所指的依靠开放数据增进GDP增长,那还有很长一段路要努力。尤其是,中国在15个关键数据的开放性上,仍旧需要进一步开放可以用于「创新」的数据,比如国家地图、企业登记注册信息等,这样才能更进一步地推动开放数据的利用,形成正向循环。

2.7 国内第三方评估

国内第三方评估由开放数据中国联合复旦大学数字与移动治理实验室在2015年启动。该项名为「开放数据探显镜」 (http://opendatalens.cn/)的项目致力于全面扫描发展动向,深度探测现状成果,细致显微问题经验。在第一期的评估中,该项目针对中国的7个地方开放数据计划展开工作。这7个地方分别是:北京、上海、武汉、无锡、湛江、宁波海曙、佛山南海。

中国开放数据探显镜的评估框架是基于「通用评估框架(Common Assessment Framework」的。考虑到中国国情及当前推进开放数据门户建设的迫切需求,评估团队建立了三层评估模型,围绕「平台层」、「数据层」、「基础层」开展评估,其中:

基础层,全面考察地方开放数据计划的组织架构和管理机制、政策和法律框架以及地方经济和社会发展水平。

数据层,则更为侧重已经发布的数据数量,基于开放知识基金会的「开放知识定义」评估数据的开放性(如是否可机读),并考察数据元数据完整性、时效性和易用性。

而针对平台层,评估则从平台的功能和体验两方面着手。一方面考察平台是否提供了完备的数据导引、数据获取、数据应用、互动交流的功能,另一方面基于这些功能考察其相应体验及门户整体界面体验。

基础层评估结果

从基础层来看,当前各地方开放数据计划中仅有上海、南海两地得到了行政长官的公开支持,上海副市长周波、南海(前)区委书记邓伟根都在公开场合发言支持开放数据并有媒体报道,而其他地方虽有相应主管单位领导的支持,但地方行政长官在公开场合的发言支持尚未体现。

而从地方开放数据工作计划角度来看,目前上海是唯一一个有明确公开开放数据工作计划的地方。其发布的《上海市政务数据资源共享和开放年度工作计划》不但明确了整体的战略部署和年度目标,也清楚列明当年的数据开放重点领域清单:2014年计划开放190项数据集,2015年计划开放428项数据集,这份工作方案同时明确了开放政府数据项目相关的配套项目建设(例如政府数据共享政策和平台的完善)。 而在其他地方,目前只有与智慧城市、大数据等相关的公开性的政策文件,并未对开放数据专门公开发布相应政策,也为公开相应工作方案。

从管理体制而言,目前各地方一般都由原有的信息化主管单位比如当地的经济和信息化委员会负责统筹和管理开放政府数据项目,其行政级别一般与其他部门(数据发布单位)相同。目前在管理体制上,南海和上海有一定的创新突破,其主要体现在两地都明确了主管单位的职能和权限,比如南海成立了数据统筹局统筹本地一切数据事宜(包括数据开放),而上海也在2015年初将原有经信委信息化推进处更名为大数据发展处,明确体现其在大数据时代的新定位和职能,统筹推进开放政府数据工作。

平台层评估结果

从平台层来看,当前各地方开放数据门户的建设普遍能够满足基本的数据导引和获取,但在与用户的互动交流上、数据获取的便捷性上、以及数据应用的展示上仍旧存在诸多问题:

在互动交流方面,虽然多数地方的开放数据平台都提供数据评价功能以及数据请求功能,但多数需要用户注册登录,缺乏便捷性。其次,平台的互动交流功能缺乏及时有效的回应,有些开放数据平台虽然提供了单个数据集的评价功能,但是经过评估团队实验,实际情况为可以提交评价、但一直没有在网页上显示,至于原因是审核尚未或未曾通过,还是评价功能“有名无实”,则不得而知。

而在数据获取方式方面,平台的数据获取普遍缺乏便捷性,大多都必须进行事先的注册登录,且平台注册难度较大,不利于民众快速、便捷地获取平台数据,由此对民众的积极性和满意度有一定的负面影响。而且,多数地方的开放数据平台都未提供数据内容的预览功能,有些开放数据平台即使提供了这一功能,也只是提供了部分数据内容的预览;有些开放数据平台则仅以图片形式或者站外链接的方式来实现这一功能,不利于为公众创造便利的数据获取体验。

而最后,对于数据应用而言,各地方的开放数据平台所提供的数据应用数量还较少。有些平台虽然开设了数据应用频道,但是平台上现存的“应用”并非可下载、可使用的数据应用,而仅仅是功能测试之后的结果;有些平台虽然提供了可下载、可使用的数据应用,但大多并未利用本站数据,或仅仅浅层次地运用了地理位置等基础数据,或即使利用了本站数据也并未对具体使用了哪个数据进行说明;有些平台提供的“数据应用”名不副实,实际上是地方政府部门的政务业务处理系统,是开放数据的来源,而非是数据开放后的实际应用。

数据层评估结果

从数据层来看,当前各地方存在数据数量整体偏少且可机读比例低、数据多为静态且不按时更新、数据授权协议条款模糊的问题:

就数据数量和可机读性而言,大量高价值,且不涉及到国家安全、商业机密和个人隐私的数据尚未能开放,截至2015年5月,受调研地区的总数据发布量仅为2000个数据集。而各地平均可机读比例仅81%,其中上海发布的可机读数据数量最多(398),北京海曙则发布可机读数据比例最高(100%),而武汉所发布的数据中46%的数据为不可机读数据,其中大多以PDF或数据可视化截图代替可机读数据发布。

而从数据的更新频率来看,目前各地方所发布数据中平均86.25%的数据是静态数据(以年为单位更新,或按需更新)。在如此低比例的动态数据的前提下,各地数据更新情况仍旧无法令人满意,仅17.21%的数据按时得到了更新,大量数据虽然清晰标明了更新频率但是均未真正实现承诺。

最后从数据授权角度而言,目前各地方都采用了网站免责条款/用户协议的形式对所发布的所有开放数据进行了一次性整体授权。但在相应条款的编写上,则存在较为严重的问题,尚不符合开放数据的法律开放性的原则。主要体现在两个方面:一个是部分地方的授权协议中含有明显有违数据开放性的条款,比如“不得有偿或无偿转让在本网站中获取的各种数据资源”。二是协议中通常对用户的权利含糊不清,未能明确、清晰地赋予和保障使用者的相应权利,比如多个地方都没有条款来明确使用者拥有自由分享传播的权利

2.8 社会对开放数据之认知

社会对开放数据的认知和态度将会决定社会力量参与倡导并利用开放数据的程度。

2015年初,开放数据中国针对当前中国社会各界了解开放数据的程度进行了一次小规模的问卷调研。参与问卷的人群主要来自北京、武汉、上海三地,工作在政府、高校、规划院、NGO等。在收到的近200份答复中,80%的人认为数据免费等同于数据开放。从这一点来说,对于社会大众而言,现阶段的主要焦点还是在于是否能够访问到政府的数据,而不是关心这样的数据是否能够易用(可机读)、是否可以自由使用(开放授权性)。一方面是因为长久以来政府数据对于社会大众而言过于封闭,所以大众在现阶段最关心的是政府数据能否不那么封闭。另一方面,也说明开放数据作为一个新兴概念尚未在社会普及。

而在问卷调研中,开放数据中国关心的另一个问题则是对于现有的开放数据门户,社会大众是否了解他们的存在?问卷调研的结果显示,50%的人群从未听说过任何一个开放数据门户,但其中最早的开放数据门户(上海)早在2012年就已上线。这也暴露出目前政府在运作开放数据项目时,对社会大众的推广宣传的力度不足,不但开放数据这一概念尚未能够很好地得到普及,连作为项目核心用于提供数据资源的开放数据门户也未能得到足够的推广宣传,吸引社会大众的使用。

而在2015年下半年,开放数据中国针对SODA的参赛人群开展了二次调研。面向SODA的参赛选手,开放数据中国在SODA比赛后发放了比赛反馈问卷其中包含了2015年初的认知问题部分,参赛选手可自愿选择是否回答。在总计135份的答卷中,100%的参赛选手知晓datashanghai,60%的人明确知晓数据免费不等同于数据开放(较2015年初改善40%)。而这种变化的一种可能原因则是因为SODA作为一个文化改变的契机,使得更多人能够具象地了解到底什么是数据开放,从而更好地理解其概念并作出判断。

案例:上海开放数据发展

3.1 上海开放数据的发展路径

上海市政府长期以来在政府信息透明化和重利用的工作上都在寻求积极的前沿探索。

试点阶段(2011-2013)

2011年,上海市政府启动了关于《加快推进公共信息资源向社会开放促进信息服务业发展》的研究,从理论层面论证上海开展数据开放工作的必要性、紧迫性和可行性。基于该项研究的成果,由市经济和信息化委员会与上海市政府办公室信息公开办牵头,推进上海市的开放数据工作。

2012年2月,市政府明确由市政府办公厅、市经济信息化委牵头,正式启动由市公安局、市规划局、市交通委等9家单位参与的开放数据试点工作,推开了上海数据开放工作的序幕。

试点工作的第一阶段,主要以各试点单位在原有政府机构官方网站开设数据服务专栏为主。通过在网站开设特定专栏,以网页表格形式提供数据清单,便捷利用方下载数据。

而与此同时,上海市经信委委托万达信息股份有限公司开发了综合性的开放数据门户,并于2012年6月上线了全国第一个开放数据门户 datashanghai.gov.cn。该平台的上线是中国在开放数据领域所迈出的第一步。

在对外开放的同时,上海市经信委同时搭建了上海市信息资源目录管理系统,以试点单位为基础,开始梳理并编目政府数据资源,基于各部门自行梳理并编制的数据资源目录,促进政府部门间的资源透明程度,激励部门间的数据共享,并在此基础上,进一步推动数据对社会开放。

推进阶段(2014-至今)

而从2014年起,上海市经信委基于试点情况,开展了上海市开放数据工作的全面推进。在此阶段,经信委对其资源目录编制工作开展了全面深化推进,以4:3:3的分配比例要求各部门在2014-2016三年内有序梳理自己部门所掌握的数据资源,按照实际工作情况和需求确定数据共享和公开等级。同时,针对政府信息资源服务平台管理办法的立法开展调研,明确政府数据采集、发布、更新、安全保障等工作规范。并逐步将政府数据共享和开放工作纳入市信息化项目竣工验收和运维预算管理体系,作为市政府信息公开年度评估内容之一。

与此同时,上海市经信委公开发布了《上海市政府信息资源向社会开放工作计划》,明确年度工作任务和重点开放领域,确定年度数据开放的数量目标要求,以及数据内容类型要求,共涉及交通、教育、科技、金融、健康卫生、公共安全、公共文化等领域的政府数据。在2014-2015两年的工作推进中,上海开放数据门户的数据数量从原有200余条增至500余条再至800余条,且同时从原有静态数据开放突破至以应用程序接口开放的动态数据。

在底层建立工作机制推进数据资源梳理和开放的同时,上海市经信委同步推进了datashanghai门户的改版。该项工作全面改善了第一版网站的版面样式及数据分类方式,以信息展示、需求评价、数据产品开发、用户分析为重点重组了网站信息架构并开设了用户需求提交和App栏目。进一步,为了迎合当前用户群体移动浏览的特点,datashanghai网站也同时做了移动端优化,推出了移动版的datashanghai门户。

而针对上海开放数据的生态建设,上海市经信委也利用专项资金、应用竞赛等各类手段,建立鼓励各类社会主体利用开放数据的机制。

2014年,上海尝试举办了第一次应用竞赛,面向社会大众征集利用公共数据资源的创意。该项比赛吸引了17支队伍提交作品,最终由上海交通大学的参赛团队以一项改革垃圾回收服务的“金金回收”应用创意摘得桂冠。回顾此次大赛,并未能充分吸引社会力量参与,究其原因有三点:第一,并未能向参赛者提供有价值的参赛数据;第二,并未框定比赛主题,导致参赛主题的不明确与评审的困难;第三,并未能真正市场化运作,激励市场响应政府数据开放的新变革。

在2014年的基础上,上海市经信委联合上海市交通委于2015年共同主办了第一届上海市开放数据创意应用大赛(SODA,Shanghai Open Data Apps),聚焦于交通领域激活开放数据潜能。该项比赛不同与2014年的大赛,其由中国工业设计研究院承办,充分调动市场积极性,并吸纳社会力量如高校(复旦大学、上海交通大学)、企业(美蒽朗)、民间团体(开放数据中国)参与大赛的设计和运作。SODA大赛同时通过经信委和交通委的协调,获取了超过1TB的来自地铁、强生出租、微博、气象局等多个渠道的交通及交通相关数据。此次大赛吸引了近5000人的报名,共形成800多支队伍,收到参赛作品超过500件,不但进一步提升了社会参与并利用政府开放数据的意识和积极性,也同时真正通过政府数据开放为政府本身带来问题解决的新思路和做法。

3.2 上海开放数据发展的优秀实践

完善机制体制

上海开放数据的发展离不开政府对相应机制体制的完善。

从体制上而言,上海市经信委下专门从政府数据战略考量出发,设立了大数据发展处,统筹大数据领域内的数据交易、共享和开放事宜,能够更好平衡交易、共享和开放间的博弈,并在推动宏观概念上的数据流通时,通过不同的方式加以探索路径,逐步向开放过度。

而从机制角度而言,上海市目前已经出台了《上海市政务数据资源共享管理办法》、《政务信息资源共享与交换实施规范 第1部分:目录元数据》等文件,加强对政府内部数据的标准化管理,建立起标准的数据流通机制,从而保障了政府数据能够更为轻易、有序地向社会开放。

公开透明发展

上海开放数据工作中值得称道的一点是将其工作的计划内容予以公开发布。

在由上海市经信委拟定并公开发布的《上海市政府信息资源向社会开放工作计划》中,上海市经信委除了对社会公布其本年度的工作目标、工作任务以及工作要求外,也一并对社会公开本年度计划开放的数据清单,并要求各部门依据此清单进一步细化自身的数据释放计划,且细化后的数据清单也要公开发布。

调动市场活力

上海的数据开放工作并不仅仅依靠政府单方面推进,通过市场合作、政府采购等方式,上海市经信委充分调动市场的积极性,让专业的人群来办专业的事,全面推进数据开放的进程。

从合作角度而言,上海市开放数据创新应用大赛便是最佳的案例。在承办单位中国工业设计研究院组建的组委会中,上海市经信委也占一席,与来自学界、企业、民间团体的组委们共同合作,商定比赛的目标、策略,并在充分讨论调研数据需求后,配合大赛需要,响应市场需求,通过发挥其本身行政力量,说服并推动相应部门和单位的数据开放。

从政府采购角度而言,上海市经信委管理下的信息化专项资金面向社会采购“政务数据资源共享和开放绩效评估”、“政务数据示范性应用”、“公共数据资源开发利用的宣传推广、技能培训”等服务。通过政府专项资金调动市场积极性,在特定专业问题上信任市场力量,将专业的事情交给专业的人群,通过「政府提供资金-市场提供服务-政府落实工作」的方式,进一步推进了上海市的数据开放工作。

3.3 上海开放数据生态圈初窥

复旦大学数字与移动治理实验室

复旦大学数字与移动治理实验室(DMG)成立于2010年,致力于对政府治理在数字时代所面临的新机遇和新问题进行学术研究、应用实验与决策咨询。力求在开展理论研究的同时,推动信息化在政府治理中的应用。

在开放数据问题上,实验室主要针对政府数据开放展开了咨询和研究,具体成果有:

  1. 1.

    承接2014国家自然科学基金面上项目:「大数据背景下开放政府数据的因素与机理研究:系统动力学建模与政策仿真」从开放数据生态角度解析并研究中国开放数据的发展,促进供需平衡和良性循环。

  2. 2.

    协同开放数据中国及世界银行组织上海开放数据论坛,邀请国内外开放数据专家和政府机构探讨开放数据的生态圈建设,吸取同行及国外建设经验。

  3. 3.

    承接上海市经信委课题,为其开展2016-2018年三年的数据开放规划工作。针对现有的数据编目目录及国家政策和民生需求,为上海市经信委产出了三年共15个不同主题的数据规划内容。

  4. 4.

    作为SODA组委会成员之一,构思SODA的名称及使命,为SODA的选题和案例追踪评估提供咨询。

协同开放数据中国开展中国开放数据探显镜项目,作为独立第三方评估中国地方层级的开放数据绩效,并给出改进建议。

开放数据中国

诞生于2014年的开放数据中国(opendatachina.com)一直从民间倡导数据开放,推动开放数据的生态建设。在近年内,借由上海市开放数据创新应用大赛和政府及其他利益相关者展开了合作。

开放数据中国起源于英国开放知识基金会,自2014年2月成立以来,主要从三个方向推动中国数据开放事业:

  1. 1.

    推进中外开放数据交流,提升中国数据开放能力:开放数据中国在2014年和世界银行及复旦大学组织了第一届上海开放数据论坛,而在2015年又筹划了第二届上海开放数据论坛。论坛邀请了英国、美国、世界银行等国际机构代表,同与会的上海开放数据团队及其他省市开放数据团队进行了交流。

  2. 2.

    追踪中国开放数据发展,评估开放数据绩效:开放数据中国长期追踪中国开放数据的发展,并整理汇总了“中国大陆开放数据发展时间线”。而在2015年,开放数据中国更是联合复旦大学数字与移动治理实验室对中国地方上的8个开放数据计划开展了第三方评估。

  3. 3.

    宣传开放数据案例,组建开放数据社群:开放数据中国的一个主要目的是连接利益相关者形成良好生态,为此,开放数据中国推出了INSPIRE开放数据案例库,用于向政府和公众宣传开放数据所能带来的变化。同时,开放数据中国长期策划组织线下活动,凝聚关注开放数据的群体,开展黑客松、培训、共创活动来推进政府-公众的合作,并进一步推动数据的开放。

中国工业设计研究院

中国工业设计研究院主要通过SODA大赛组织和项目孵化来推进上海开放数据的发展。

中国工业设计研究院是由中国工业设计协会和上海市经济和信息化委员会共同筹建的专注于工业设计、服务设计、大数据战略设计的企业。自2015年开始,中国工业设计研究院承办SODA大赛,着手推动上海开放数据的需求端建设,通过市场化运作,吸引社会人士特别是创业人群对开放数据的关注,从而加速开放数据的成果转化,提高利用率,并携手政府、孵化器等共同探索开放数据应用的落地方式。

围绕SODA大赛,中国工业设计研究院也与英国驻华大使馆开展合作,奠定了中英开放数据合作交流的基础。其积极与英国开放数据研究院、Digital Catapult等开展交流,探索适合于中国的开放数据孵化器模式,并借助这些合作关系让SODA大赛走出国门,更好地吸引英国的创业者,发现中国开放数据所能带来的市场机遇,引入英国成熟的技术方案,从而进一步促进两国间的科技交流和商业合作。

OMNILab

上海交通大学 OMNILab 是上海开放数据生态圈中的技术支撑力量。

OMNILab 是中国最早一批使用 CKAN 架设数据门户,并对外开放自采集数据的。在 OMNILab 的数据平台上(data.sjtu.edu.cn)目前开放有上海交通大学的环境传感器实时数据、校园一卡通数据、气象数据等内容,虽非十分丰富,但在技术的探索和试用上,为其他感兴趣开放数据和 CKAN 的人做了很好的示范。

同时 OMNILab 也为上海的SODA大赛提供了技术支持,为大赛提供数据清洗、存储的服务,作为身份上相对中立的第三方(非政府、非营利企业),其很适合承担这样的任务来优化现有政府的供给,同时确保了数据本身的安全性。

OMNILab 亦和上海气象局合作,研发可穿戴的气象传感器,通过招募志愿者佩戴,测试大规模人群的移动气象感知,并逐渐探索可持续开展的方案。相应的数据未来也将通过开放数据的形式提供给社会加以分析利用。

中国开放数据发展的共性问题

4.1 如何界定开放数据的范畴

对于中国开放数据工作的决策者而言,如何基于现有的信息公开的工作进一步确定开放数据的范畴是最主要的问题。

这不仅事关于确定开放数据的工作范畴(哪些内容开放),也事关于主管部门如何确保在工作推进中本身不受到国家秘密、国家安全等因素的阻挠。唯有明确确定内容的范畴,才能更好的基于现有的法律框架来推进相关部门的配合。

从国际共通的开放数据基本原则来讲,开放数据的底线是排除个人隐私、国家秘密和商业秘密的数据,但在具体如何界定个人隐私、国家秘密和商业秘密的问题上,则是在过去近10年的信息公开工作中都未能明确的。这也就给中国的开放数据工作带来巨大的挑战,在数据交易、数据开放、数据共享三者之间如何清楚界定不同数据可以流通的准则和地方的时间标准,都将是地方的决策者和实践者都需要去探索,并需要具体的答案的。

同时,随着本身中国法律的逐步完善,以及科技的不断进步,对于同一数据内容的开放与否,可能在不同时间点都会有不同的态度和意见,而这也就相应带来更为复杂的决策过程。英国开放数据研究院所推出的「数据光谱(Data Specturm)」也就描绘出数据的本身流通属性(例如开放 v.s. 不开放)是十分多元的,很难静态地来决定一个数据本身的流通属性,而需要结合本身的发展需要、本地法律情况等多方面因素,来作出决策,甚至就此推动相应内容的尝试和突破。

4.2 如何激励或要求部门提供数据

另一多个地方政府及相关国家机构都感兴趣的问题是,如何才能更好激励或者要求掌握有数据的部门来提供数据。

目前在中国,开放数据的管理机制中通常是由本地负责信息化工作的职能单位来负责开放数据工作的政策制定和具体工作的协调开展。其行政等级多数情况下是平行于其他掌握数据的职能部门的,但有时也可能高于或低于其他部门。在这样的情况下,一般此类开放数据的主管部门仅能通过手中掌握有的信息化项目财政预算的审批权力来「推动」相应部门的配合,但这样的方式并非长久之计,也不能真正得到相应部门对开放数据的支持,并让他们愿意主动开放数据,保持稳定的数据供应和更新。

同时,除这种「利益交换」式的方式去推进相应部门提供数据之外,以「绩效考评」的方式引入同行竞争,也可以推动相应部门去改变原有政策从而更为配合相应数据开放的工作,但这一方式的开展在中国目前尚属初期,目前可能仅有上海已经设立了相应的考评机制来,是否能够有效还需要时间来验证。

但实际上除了上述两种相对「被动」的推动方式之外,如何引入「主动」推动的激励方式是目前中国开放数据发展急需去探索的。所谓「主动」推动的激励方式即是要让数据提供部门能够了解到数据开放之后对于该数据提供部门能够带来的具体的好处,比如数据开放帮助该部门能够切实解决某一问题,降低某类信息公开的请求率等,将这种具体开放数据的ROI(投资回报)引入,通过宣传教育的方式,更好地吸引相应部门在开放数据工作规划中的产于,将会是中国开放数据发展接下来值得探索的方向。

4.3 如何建设、运营开放数据门户?

如何建设并运营开放数据门户则是另一个受人关注的问题。

目前中国开放数据发展的目标是在2018年上线国家级的开放数据门户,但其应当由谁来负责建设则是目前尚未确定的。而对于不同的政府部门或者地方政府而言,是否应该投入资源建立开放数据门户又或者是基于自身现有的政府网站提供简单的数据索引即可,则也是未曾有确定答案的问题。

另一方面,建设开放数据门户是否应该交给企业来主导?如果是的话,通过一定的政府招标流程即可完成工程的建设。但在这个过程中,是否意味着政府需要将数据的管理等内容一并外包给企业?这当中如何确保数据的安全?如果不交给企业来做,政府自身又是否有能力来完成相应的工作?

同时,开放数据门户是否应该通过标准化的云端服务完成?还是应当尽可能由本地开发商来客制化自身的数据门户?又或者是通过开源的系统,比如CKAN, 来完成数据门户的建设?这些都是目前各级政府面临开放数据这一项新工作时需要思考的问题,也是切实摆在面前的难题。

而当我们谈论其数据门户的运营时,事情将会变得更为复杂。如果政府自身来运营政府的开放数据门户,那么如何协调不同的政府机构来运营内容,如何做资源推广并和开发者建立联系,则都是政府不熟悉且不擅长的内容。但如果将其交由企业来做,又如何保证该企业不应管理或者运营开放数据门户而变为某种新的寡头,并引起新的「权力寻租」问题。

英国开放数据发展概览

5.1 英国开放数据的发展路径

培育阶段(1998-2009)

早在90年代末期,英国公务人员和社会活动人员就已开始推动政府数据的开放。而1998年所发布的《信息时代的皇家版权》绿皮书则第一次为开放数据奠定了至为重要的道路。在这份报告中首次提出了一种“即点即用”(Click-Use)的授权方式,而这一方式在2000年得到落实,使得任何人可以在接受署名条款的前提下,商业化或非商业化自由使用任何授权在皇家版权下的内容。

而在2003年,欧盟通过了《重用公共信息法令》,为整个欧盟国家提供了开放数据的基本法律支撑。而在2005年,英国信息公开法的正式生效(1月)和欧盟《重用公共信息法令》的生效(11)则为英国进一步开展开放数据彻底完善了法律上的基础架构。

除了政府努力外,社会各界也在积极投入开放数据的运动。其中英国开放知识基金会一直引领着数据开放的讨论,对政府本身的政策提出了批评。而卫报所发起的「解放我们的数据」运动,则进一步推动了社会大众对公共数据开放的关注。

而在2008年,英国政府成立了「信息的力量」工作组,此小组由内阁办公室和来自政府、企业、社会团体的代表构成,并基于此,发起了「向我们展示更佳的做法(show us a better way)」竞赛,将一批原本封闭的数据例如统计普查、学校地址和统计、医疗信息等对开发者开放,从而诞生了例如「我的钱去哪儿了(Where Does My Money Go)」这样的优秀应用。

推进阶段(2009-2011)

而在2009年,因为美国奥巴马政府的强势推动,美国政府正式开启了开放数据的运动,上线了为人熟悉的data.gov 平台。与此同时,英国也上线了 data.gov.uk,并见证了开放数据运动的高速发展。

如果说2009年前,人们尚不熟悉开放数据而多以「重用公共信息」来讨论问题,那么2009年则是整个文化变革的元年。无论是政府还是社会活动人士,都已经开始使用开放数据作为他们讨论的术语,并且积极推动本行业对开放数据的认知。

在2009年9月上线 data.gov.uk 后,英国政府任命了万维网之父 Tim Berners-Lee 与时任英国南安普敦大学教授的 Nigel Shadbolt 作为政府顾问,指导数据开放工作,并在2010年1月正式对外启动 data.gov.uk。而在2010年的大选中,卡梅伦作为保守党领袖发布了「保守党技术宣言」,号召英国应当改革法律,从而能够确保人们「获取政府数据的权利」。而之后,时任首相布朗则发布了「国家数字战略」,提议建立万维网科学研究院(Web Science Institute),但该计划随后在卡梅伦获选后遭到取消,转而建立了透明化委员会(Transparency Board)。

2010年9月,英国政府正式发布了「开放政府授权协议(Open Government License)」用于取代原有的「即点即用(Click-Use)」,而此为随后英国开放数据生态圈的发展奠定了夯实的基础。

2011年,英国作为8个发起成员国,共同组建了「开放政府联盟(Open Government Praetorship),并推出了第一个国家计划。

成熟阶段(2012-至今)

2012年,原有的万维网科学研究院提案再次被提起,此次卡梅伦政府决定改建其为「开放数据研究院(Open Data Institute)」,并于2012年9月正式成立。

2012年5月,英国政府依据「需求驱动」的原则,建立了「开放数据用户组(Open Data User Group)」,任命 Heather Savory 为主席,负责响应用户对数据的需求,并充分调研满足数据需求的可行性和价值。

同年6月,英国政府发布了极具影响力的「释放潜能——开放政府数据白皮书」,并要求各政府部门制定工作计划。而在12月,德勤公司发布了「开放增长」报告,对英国开放政府数据的供需两端情况进行了调研。而此报告也为2013年5月发布的著名的「莎士比亚评估」报告奠定了基础。

「莎士比亚评估」报告指出「开放公共数据以满足政府透明化之需要,与制定国家数据战略来满足经济增长是截然不同的两条路线。如何建立合理的数据战略则是目前重中之重的问题」,为此提议英国政府必须要清楚界定数据权属,制定国家级数据战略,加速工作的开展实施,对基础设施和研究进行投入,确保生态体系中的信任。而英国政府随后也基于该评估,对英国数字化战略进行了调整和实施。

2013年,英国开放数据研究院与英国国家科学技术与艺术基金会共同开展了为期3年的英国开放数据系列大赛,涉及「食品」、「社会治安和犯罪」、「文化遗迹」等7个主题,选拔并孵化了一批有价值的新兴创业企业,并进一步推动了政府数据的开放。根据普华永道所做的竞赛影响力评估,大赛所投入的每1英镑,都能带来10英镑的回报。而在大赛基础上,英国开放数据研究院也进一步领导组建了欧盟开放数据孵化器,将英国模式输出到欧盟范围内,并于2015年和马来西亚政府合作,将该模式引进了亚洲。

5.2 英国开放数据优秀实践

建立用户需求调研和可行性分析机制

英国开放数据用户组(Open Data User Group,ODUG)是英国政府于2012年发起成立的独立机构。其主席由英国内阁办公室任命,任期三年,但其所有小组成员均来自企业、非营利机构、大学等非政府机构。ODUG 成员每年更新一次,公开招募,个人提出申请后将由遴选委员会选拔,一般倾向于有商业背景、有开放数据利用实际经验和需求的申请者。

ODUG 的主要职责在于两个方面,一方面是设立用户需求的采集渠道,即在 data.gov.uk 门户上开辟一个功能,允许任何人提交数据需求,并由管理员汇集需求,基于涉及部门、内容类型、需求理由等对需求进行整理。

在收集需求后,针对高需求数据,ODUG 担负的另一个责任即是针对该高需求数据,调研其是否真正是高价值数据,且如果开放,能够带来怎样的影响力。在2012-2015年间,ODUG 针对英国税收数据开放的价值、英国国家地址数据的价值、英国国家土地交易历史价格数据的价值、英国邮政编码数据的价值、英国家庭医生数据的价值等展开了详尽的研究。

其所做的研究结果都在之后深刻影响了政府推进开放数据的步伐。例如其对国家地址数据的调查,影响了英国政府在2015年决定出资38万英镑提供英国开放数据研究院启动一个全新的开放地址数据库项目,试图重头再建地址数据库从而替代已经被皇家邮政私有化的地址数据库。而在2016年,英国政府加大了投入,决心投入5百万英镑,进一步推动该数据库的建设,并使之开放.

建设开放性的数据基础设施

数据基础设施(Data Infrastructure)意味着数字化时代,数据就像道路、桥梁一样是社会发展和商业发展必不可少的基础。在数据基础设施的建设上,英国政府启动了国家信息基础设施计划(NII),该计划将会确定纵向(垂直行业)和横向的关键数据,提供一套原则框架,使得数据能够共享或开放提供给社会使用,支撑各类社会发展和商业发展活动。

2015年,ODUG发布了《国家信息基础设施:为什么,是什么,怎么做》的政策报告。该报告指出,NII应当针对垂直行业,确定该行业的核心参考数据(Core Reference Data),对象数据(Subject Data),主题数据(Themantic Data)。比如,对于医疗而言,其核心参考数据包含了医疗诊断术语表、地址数据等,而对象数据则包含了机构、人等主语对象的名录,主题数据则是与医疗业务本身更为相关的例如999电话、医疗诊断记录等。

目前英国政府的NII计划完成了第二次迭代实施,确定了「安全、用户为中心、完善管理、可靠、良好维护、灵活」的六大原则,来推动NII数据的确定和释放。同时也已经对各不同行业主题进行了梳理,并在探讨如何界定这些基础数据的开放性。从最大化释放该NII价值的角度来说,除了部分涉及隐私和秘密的数据之外,整体NII都会以开放数据的形式提供给社会,并同时吸纳社会数据,进行多元数据的整合利用。

设立专项资金突破开放数据难题

英国政府为了推动地方政府的数据开放,并协助突破一些开放数据发展过程中的难点问题,专门设立了两个专项资金:数据释放基金和突破基金。

数据释放基金由内阁办公室设立,提供了7百万英镑的基金池,用于支持能够推动数据进一步释放的研究或实践项目。研究机构、政府、企业均可以提出项目方案进行申报。往期的项目中包括了诸如前文提到的开放地址数据,其就是由数据释放基金资助(38万英镑),由英国开放数据研究院去试验地址数据的开放工作。而研究类项目也是该基金支持的对象,比如英国开放知识基金会推出的开放数据指数项目(城市级别),也曾得到该基金的资助,用于通过众包方式调查英国各城市的关键数据集的开放程度。

而突破基金则更多被用于协助突破阻碍某一数据开放的瓶颈。其由商业创新部设立,提供了250万英镑的基金池。该基金曾经资助了例如立兹市建设其开放数据门户Leeds Mill,谢菲儿德市建设其开放的空气质量监测网络等。

5.3 英国开放数据生态圈初窥

英国开放数据研究院

英国开放数据研究院(ODI)是由英国创新署出资1000万英镑,Omydiar Network投资475万美金所创建的独立的、非营利的机构。其由万维网之父 Tim Berners-Lee 担任总裁, Nigel Shadbolt 教授担任董事会主席, Gavin Starks 担任 CEO。

ODI的业务共三个模块:咨询培训、商业孵化、研究技术。

其中咨询培训主要面向政府推出了国际开放数据领导者网络项目,组建领导者网络促进经验交流。并面向政府机构提供咨询服务,在开放数据的战略、策略、具体实践等不同层面上提供咨询。同时其也面向商业企业等提供培训服务,帮助理解开放数据理念,并探索开放数据的商业模式。

而在商业孵化上,ODI设立了一个实体孵化器,吸引创业企业入住,帮助工作在开放数据上的创业企业对接到数据、资金、宣传的资源,但本身并不投入任何资金。同时ODI也负责架设了一个虚拟的欧盟开放数据孵化器(ODINE),通过欧盟 Horizon 2020 的研究资金为选拔的创业企业提供初创资金,但并不占任何股权。

而对于研究技术模块,ODI目前为英国政府开发大量的小巧工具,帮助政府能够更快清洗、脱敏数据,亦有工具用于评估数据质量,及帮助政府自我诊断当前机构开放数据的准备度。同时,ODI也追踪开放数据的使用情况,调研开放数据的生态发展等,从研究角度为政府及企业提供咨询,促进整体生态的发展。

英国开放知识基金会

英国开放知识基金会(Open Knowledge Foundation,OKF)是一家成立于2004年,由 Rufus Pollock 博士创建的非营利机构。英国开放知识基金会长期以来一直作为独立的开放数据的倡导者、监督者和推动者,为政府、社会团体、企业等提供咨询和研究服务,并为国际开放数据的发展提供了标准化的定义、授权协议及工具。

OKF的主要工作包含了开放数据指数(Open Data Index)、CKAN、及开放知识定义: 开放数据指数,是一个通过众包方式对全球各国政府开放数据现状开展评估的项目,其目前已经对全球122个国家开展了相应评估,每年更新一次。

CKAN,是由OKF推出的一套开源的开放数据门户解决方案。美国的 data.gov 和英国的 data.gov.uk 均采用了该套解决方案,目前至少有上百个国家、区域、地方政府或国际组织使用了该解决方案搭建自己的开放数据门户。

开放知识定义 (opendefinition.org)是OKF提出的对开放数据的标准化定义,其延请了国际专家组建顾问委员会对定义进行完善,并对不同政府、机构所提交的开放数据协议进行审核,验证协议是否符合开放知识定义,并提出相应修改建议。

Digital Catapult

Digital Catapult 是2013年由英国创新署资助成立的,致力于推进数字经济增长的企业,同时也是一个非营利的研究机构。

Digital Catapult 的工作是开放数据的外延,触及更为广泛的数据共享,其工作重心为:

探索机构间封闭数据的共享 ,其先后探索了建筑行业数据共享平台、环境行业数据共享平台,试图搭建一个共享市场,将开放数据、共享数据、封闭数据放置在一个「市场」下,促进数据的流通。

探索个人数据的安全可信赖共享 ,其致力于研究个人数据可安全信任共享的技术和标准框架,其组建由 个人数据 & 信任网络 (personal data & trust network,pdtn.org)

探索如何简便共享需授权数据和内容 ,其利用开源技术为「Copyright Hub」搭建了技术平台,便捷数字数据和内容的授权,他们已经和包括大英图书馆,BBC等机构开展了合作。

探索共享不同物联网数据,通过设立诸如 Powering IoTUK 这样的网络来推动英国物联网的发展,并促成数据的流通。

Bristol Is Open

Bristol Is Open 是由英国布里斯托市和布里斯托大学共同出资成立的企业。其致力于和科技、媒体、通信等企业及大学、社区还有政府合作,共同推动「开放城市」的建设。

所谓「开放城市」即「城市即平台」的延伸,通过开放数据的形式,将整个城市变为一个实验室,让城市创新者在其之上进行数字化创新和实验,改善公共服务,提升生活质量。

布里斯托市目前借由该公司的运作,自2015年秋已经启动了第一阶段的为期一年的实验。城市的传感器网络及政府原有采集的数据都将开放给社会重利用。

实验阶段的一个产出成果是「布里斯托数据穹顶(Bristol Data Dome)」,该项目通过3D形式,对布里斯托的数据进行虚拟现实形式的可视化,帮助人们能够通过这一非同寻常的方式发现城市数据的新模式。

而在2016年春,Bristol Is Open 将会进一步开放其物联网架构,允许更多呃物联网设备接入其数据平台,从而能够提供更多的数据给终端开发者利用,使得整个城市真正成为一个可读可写的「操作系统」。

中英开放数据合作机遇

6.1 合作资金

中英机构和企业若希望在开放数据及其相关领域:智慧城市、大数据等上开展合作,可寻求以下合作资金的支持:

中国繁荣基金

中国繁荣基金(China Prosperity Fund)由英国外交和联邦事务部所设立,其在2016-2020的5年内将预计投入1500万英镑。在2016/2017财年,该基金的总体目标是推动经济改革和增长,支持中国实施十三五规划。其覆盖了金融、国内及跨境投资、参与国际经济贸易事务、结构性改革、能源和资源安全、清洁和低碳转型六个主要战略目标。

其中结构性改革下的目标4.2「中国的科研政策朝着更加开放的方向发展,鼓励在能驱动未来经济增长的领域开展国际创新合作」支持「中国的开放数据的监管框架进一步开发并实施」的项目,其项目内容包含但不限于:帮助制定关键领域新的国内和国际法规,包括大数据和开放数据(如地理空间数据)标准,帮助中国开放市场,建立国际商业伙伴关系和平台(如地理空间数据、智慧城市、其他开放数据应用)

基金可以支持单年度项目或多年度项目,项目资金一般为100,000英镑上下。

关于中国繁荣基金的更多情况可以参阅: https://www.gov.uk/guidance/china-prosperity-fund-bidding-round

中英研究与创新桥计划

中英研究与创新桥计划是英国科学委员会、英国创新署(Innovate UK)和中国科技部合作支持的一项旨在支持中英在科研成果转化领域的合作,为两国发展进程中所面临的具体挑战提供解决方案的资助项目。

2016年拟支持的重点领域与重点方向如下: (一)城镇化(智能交通、物联网、土壤及地下水修复) (二)医疗保健(老龄人口医疗保健、平价医疗技术和医疗设备) (三)农业技术和粮食生产(可持续集约化、农业遥感) (四)能源(可再生能源技术和设备)

工作在上述方向的数据驱动类项目均可以基于当前中英开放数据合作进一步探索相应的可能方向从而申请该项资助。该资助计划鼓励产学研结合,采取“2+2”合作模式,即项目参与方包括一中方企业和科研机构、一英方企业和科研机构,原则上要求企业提供至少与政府资助等额的配套出资。项目内容必须是应用研究而非纯学术研究。

资助金额方面,中方科技部最高支持500万人民币,而英方最高支持为100万英镑。

更多关于中英研究与和创新桥计划的信息,可参阅英国创新署官方网站或中国科技部发布的申报通知。

6.2 合作方向

建设国家数据基础设施

英国政府所推动的国家信息基础设施(NII)针对国家数据战略中各领域的关键数据进行了梳理,且在英国开放数据研究院、英国开放数据用户组等机构团体的倡导和推动下,NII将探索如何开放关键数据,从而建成开放的数据基础设施来助力商业和社会的发展。对此,中国的政府机构和智库可和英国政府及英国开放数据研究院展开更为深入的交流,合作定义中国的国家数据基础设施,确定其开放程度,并协力推动该战略的落地,促进双方基于数据基础设施的进一步合作。

加重开放数据在G20经济发展中的角色

正逢2016年中国作为G20主席国,G20峰会将在中国杭州召开,中英两国可借此机会进一步合作,加重开放数据在G20经济发展中的角色,结合国际开放数据宪章的工作,针对经济发展,共同探索、研究并倡导开放数据如何助力经济发展,具体落实到应当需要制定哪些数据标准,G20国家如何共同开放哪些关键数据,又如何确定数据流通的机制保障安全和信任,从而基于这些问题点的突破能够促进包括跨境投资、双边贸易、知识经济等经济行为。

建立政府部门开放数据成熟度评测

开放数据的供应依赖着每一个掌握数据的政府职能部门来完成,而这与该职能部门是否有成熟的管理架构、技术力量、数据标准等有关。如何去衡量一个部门在落实开放数据工作的成熟度将帮助部门自我诊断,找到阻碍其开放数据的难点和问题,从而更好推进工作。在这一点上,英国开放数据研究院曾受政府委托研究开发了一套开放数据成熟度模型,并开发了相应的在线应用用于任何政府机构的自我评测诊断。在这一点上,中国的研究机构和咨询机构可以向英国开放数据研究院学习,结合中国公共管理的具体情况,拟定一套适合中国公共机构的成熟度自评体系。

跟踪评估开放数据的影响力

为什么要开放数据?是否有证据标明开放数据的确带来不同?这就是影响力评估需要回答的问题,在英国,开放数据研究院已经开展了对全英国企业使用开放数据的调查,论证了开放数据的经济价值。而在2015年,由 Becky Hogge 所完成的开放数据影响力案例调查则揭示了包括伦敦地铁数据开放在内的6个开放数据影响力故事。对于中国而言,影响力可能谈之尚早,但仍需尽早探索跟踪评估开放数据影响力的可能路径。在这一点上,复旦大学数字与移动实验室已经开展了SODA大赛的影响力评估研究,而今后,中英两国研究机构间就这一话题应有更多的交流,共同探索方法论和交换影响力案例,从而能够助力两国的开放数据发展。

探索开放数据的商业孵化模式

开放数据的商业孵化并非一件易事。开放数据作为一种开放性的资源对企业传统垄断资源的商业模式提出了挑战,这不但需要对整个商业生态的文化进行重塑,亦需要给予不同的孵化支持来使得开放数据的企业得到成长和指引。在这一方面,英国开放数据研究院已有了充足的经验,不但运营了英国的开放数据孵化器,也运营有欧盟开放数据孵化器,更和马来西亚政府合作了马来西亚开放数据孵化器。由此,中国的政府或是专业孵化器应当尝试和英国开放数据研究院合作探索适合中国国情和商业环境的开放数据孵化模式。

助力企业发现两国开放数据资源

开放数据的发展将为企业带来不一样的商业模式和商业扩张能力。一家企业若能基于一个国家提供的开放数据开展其业务,那么当另一个国家也提供该数据时,该企业自然能够将业务扩展到该国家。比如Citymapper这款诞生于英国伦敦的应用,基于开放的交通数据,专注于出行规划业务,目前已经从英国伦敦扩张到西班牙、德国等国家,若中国城市也提供相应的开放数据,则其就能扩张业务到中国,从而为中国民众带来更好的业务,也带来新的就业机会和投资。但在这个过程中,如何能够更好帮助中英两国的企业发现相应数据资源则是需要探索的方向。中英两国的政府和企业可以探索如何提供更好的数据发现服务,建立更好的宣传渠道从而帮会组有需要的企业及时了解数据开放动态,发现数据资源,从而能更好促进两国的商业合作、跨境投资和贸易往来。

Comments
0
comment
No comments here
Why not start the discussion?