近年来,政府数据开放成为政府信息化领域的热门话题,我国很多地方也已经建成或正在积极建设政府数据开放平台。政府数据开放是政府数据资源内部生成、协同共享和开放利用的过程。推进政府数据开放,是全面推进政务公开,打造廉洁政府、创新政府和服务型政府,增强“互联网+”政务服务能力的重要途径。当前,我国政府数据开放工作还面临一些问题、存在一些挑战。
数据基础不牢,缺乏高质量的政府数据体系
政府数据开放平台中的数据格式多样,既有机器可处理的格式,也有非机读格式,格式多样使得相关人员在处理数据前需要耗费大量的精力进行格式转换。在数据平台上以非标准化的方式发布政府数据,会导致政府各平台数据不兼容,容易产生“数据孤岛”,给政府数据关联带来难度,使语义、标准等方面存在很大的异质性,从而降低政府数据的利用率。
数据质量包括用户对数据是否满足其需求的主观感知、数据本身及数据活动过程等。根据相关调查表明,很多政府机构认为,他们提供的卓越用户体验能力是被不准确的数据削弱的。如果政府数据本身质量低,会严重影响决策和政策制定过程,导致数据分析结 果不准确。从主观方面来说,用户自身及其数据利用类型决定着数据质量。对于数据利用者来说,如果政府数据没有良好的质量,不但会增加对政府数据分析的投入,还会影响数据集的再利用过程,导致政府数据难以得到充分利用,甚至会影响政府公信力。
在全世界范围内,政府数据开放面临的一个首要问题就是元数据(中介数据)质量问题。一方面,收集、处理元数据能够提升数据的适用性。但在数据平台上,元数据体系的缺乏会增加公众发现和理解数据集的难度。而通过元数据收集和处理开放数据,则易于提升政府数据的利用率。另一方面,较高质量的元数据能够拓宽数据的获取渠道。但如果数据标准不一致,对数据的描述不够准确、完整,就无法达到数据开放的目的。因此,在政府数据开放过程中,我们需要引入公共政策理论、法律法规来规范、约束政府数据开放过程,解决政府数据基础不牢,数据质量低的问题。
优化数据管理,确保政府数据的真实性、时效性
政府数据开放要求明确数据的出处:由谁创建或生成、数据来源于何处,要求政府部门必须对其生产和收集的数据负责。因此,政府数据生产、开放重在规范数据的采集、存储、利用和传播环节,数据内容管理重在确保数据的准确性、一致性和时效性。在数据生产和收集阶段,要实现跨部门、跨机构的数据整合与分析,从源头上保证数据质量,解决数据生产和收集部门的工作难度。同时,应解决数据出处不明确、产权归属不清晰等问题,提升发布或共享的数据质量,及时更新、修改生成的数据,尽量避免政府部门横向、纵向数据汇集产生 不同程度的交叉重复。另外,还应明确政府数据分类标准,不断更新清理数据,对有效数据归档存储、过期失效数据标示清楚。
政府数据应由政府统一发布、管理,按照数据类型统一数据口径,确保数据的一致性、真实性,并采用优化统计方法、监控数据质量等方式提升数据质量。同时,政府部门内部应进行数据一致性分析与梳理,在技术上统一数据采集和共享发布平台,拓展数据传播和利用渠道,制定各类数据发布、数据更新标准。另外,必须要遵循数据标准规范,减少数据格式转换,促进各业务部门、技术机构统一理解和规划政府数据资源,保证高效共享。
目前,为了满足用户数据需求,发达国家在中央政府和地方政府间,普遍建立了政府数据集中管理和整合利用模式,通过多种途径整合前后台数据资源,并以集中的方式提供给用户,实现跨区域、跨平台的数据服务。我国在顶层设计、利用流程管理、资产化管理等方面,需要进行前瞻性战略布局,建立相应的政策法规体系、统一的政府数据共享开放平台,大力增进行业与行业之间、地区与地区之间数据资源的交流和互动。同时应由相关单位协调提供相应的技术服务,借助数据共享交换平台,强化政府数据社会化利用的收费规定,明确政府数据的使用是否收费、如何收费等问题。
注重数据安全和隐私问题,加强知识产权保护力度
数据安全问题。数据具有开放性、关联性等特征,在大数据时代,数据安全属于非传统安全。因此,政府数据开放应高度重视数据安全。当前,世界各国都非常注重数据安全和隐私问题。如美欧一些国家资助大数据安全技术研发项目,借助互联网手段和信息技术对数据情报进行监控。相较之下,我国对数据非传统安全的重视程度还不够高。因此,在数据跨国流通中,我们应注重数据安全,妥善解决数据安全问题,降低国家安全威胁。比如,包括云服务提供商在内的第三方托管政府数据时,要控制数据安全的辐射面,强化数据主权意识。
个人隐私保护问题。目前,个人数据正在成为一种新的资产,在大数据环境下,政府能够收集不同类型的个人数据。但同时,政府采用数据挖掘技术大规模地实施数据开发利用,极有可能会威胁到个人隐私,增加个人信息泄露的可能性。在数据聚合过程中,通过不同数据集属性的组合、抽取等途径,还可能使个人数据面临安全风险,即使数据在发布前匿名化,也可能导致敏感数据的产生。另外,目前随着新媒体时代的来临,人们每次信息活动都会留下数字痕迹,个别科技公司滥用社交媒体上的个人数据,导致个人隐私严重泄漏。目前,在个人信息保护上,我国相关规定分散于各种法律法规中,还没有独立完整的数据保护法。因此,应从法律层面上规定、明确个人数据分类标准,并将个人信息保护纳入相关法律法规。
知识产权问题。数据开放许可是政府数据开放的一项重要原则,而数据共享造成的产权不清,则会阻碍数据的发布和共享过程。同时,数据知识产权可能会在未经明确许可的情况下,限制第三方重新利用数据。因此,只有在政府数据受版权保护的情况下,才能允许公众获取、重用和传播数据。如,欧盟委员会鼓励“使用开放许可,最终应成为整个欧盟的管理”,并发布了推荐许可的指南。目前,我国政策对数据知识产权的规定不多,政府数据开放许可的实施具有一定的难度。在制度层面上,部门信息资源的所有权尚不明确,数据管理权、使用权以及信息共享的责任主体尚未理清。政府数据开放网站的许可协议应用情况也存在一些问题,采用许可的平台规定还不够详细,一定程度上限制了政府数据的利用和再分配,这些情况都是亟需解决的重要问题。