广州公共管理评论(第5辑)
上QQ阅读APP看书,第一时间看更新

政务中国

大数据背景下行政监督信息失真的原因及规避

燕博燕博,湘潭大学公共管理学院公共管理专业研究生。


摘要:大数据时代已经到来,国内也越来越重视大数据技术在行政监督领域的应用,但如想提升大数据在行政监督领域应用实效,就必须优先解决大数据背景下行政监督信息失真这一挑战。本文对大数据、行政监督信息、信息失真的相关概念进行了界定,分析了大数据背景下行政监督信息面临的新问题,认为大数据背景下的行政监督信息失真问题形势较为严峻。并着重从数据意识薄弱、法律法规缺失、政务数据封闭、数据应用水平较低以及大数据技术条件不成熟等方面分析了大数据背景下行政监督信息失真的原因。最后,根据失真的原因提出转变思想观念、完善法律法规、开放数据,建立行政监督信息共享平台、提升数据应用水平、加强技术创新等解决对策。

关键词:大数据 行政监督 信息失真 原因及对策

引言

(一)选题背景

尽管大数据还没有一个严格的定义,但大数据技术却飞速发展,已经能够处理以前根本不敢想象的数据类型和内容。大数据被政府和越来越多的企业所重视,大数据技术也逐渐深入人心,为经济学、政治学、社会学等许多学科带来巨大甚至是本质上的变化。欧美国家政府十分重视大数据技术在政府管理领域中的应用,纷纷把大数据上升为国家战略,并加以技术引导。国内也注意到大数据发展的巨大潜力,一些发达地区纷纷制定本地区的大数据发展战略,但由于国内相关政策不健全、数据意识薄弱、数据封闭以及技术落后等原因,大数据的发展还存在许多问题。

(二)选题目的与意义

本文希望通过分析大数据技术在国内外行政监督领域的应用现状,从数据意识薄弱、法律法规缺失、数据封闭、数据应用水平较低以及技术不成熟等方面对行政监督信息失真这一现象的原因试进行比较分析,并提出相应的解决措施和解决途径,以求有利于改善大数据背景下行政监督信息失真的现状,也能对今后大数据背景行政监督信息失真的规避产生参考价值,进一步推动行政决策的科学化和腐败预测预防体系的构建,提升行政监督实效。

(三)国内外研究综述

1.国外研究综述

大数据概念的兴起与发展主要缘自欧美国家,目前大部分的研究和应用也都由这些国家掌控。目前的研究主要集中在大数据理念的推广和在商业领域的应用,针对行政管理特别是行政监督领域的研究比较少,而关于大数据弊端的研究也主要集中在信息泄露等问题上,几乎没有专门对信息失真及规避方面的研究。但是这些研究中对大数据理念、数据信息公开及预测监督等方面的内容,对我们有很大的参考价值。

关于大数据理论与概念的研究。被称为“大数据时代预言家”的维克托·迈尔·舍恩伯格(Viktor Mayer-schönberger)和肯尼斯·库克耶(Kenneth Cukier)合著的《大数据时代》就在大数据方兴未艾、众说纷纭的时刻,进一步阐释和理清了大数据的概念和特点(涂子沛,2012),计算机专家阿比舍曼特(AbhishekMetha)指出,大数据技术已经成为“信息高速公路”之后又一次重大的科技战略,我们必须认识到其重要性(舍恩伯格、库克耶,2012)。微软数据库专家帕哈兰(Pat Helland)指出,当数据达到一定数量时,难免会出现信息失真的情况,我们首先要承认和允许这些失真的存在,其次是尽量规避这些失真(陈奇星,2008)。

关于国外政府政务数据开放和应用等方面的研究。华尔街日报洛杉矶分部的科技副编辑斯科特·杜林(Scott Thurm)撰文指出,大数据技术下可以通过一个人的信用记录来预测一个人的行为方式(王云庆、刘佳慧,2013),这为通过大数据预测官员和政府的行为,建立腐败预防体系,具有重要意义。美国政府于2007年通过《开放政府法》,确保政府信息和数据的公开与透明,方便联邦政府和民众进行监督;2012年,美国政府又发布了《大数据研究和发展计划》,组建“大数据高级指导小组”将大数据研究提升到政府战略层面。2012年英国首相卡梅伦提出“数据权”概念,将政府数据悉数公开。同时,美国和英国分别开放政府信息和数据公开网站,方便社会查阅和监督政府信息。上述这些成果对本文的研究具有较大的启示。

2.国内研究综述

国内越来越多的学者开始重视大数据技术的研究,但研究主要集中在网络、通信和金融等技术和商业领域,在行政管理领域研究较少,也比较浅显,而对于行政监督特别是行政监督信息失真领域的研究几乎是寥寥无几。但是大数据在智慧城市建设、信息公开和电子政务方面的研究对本问题都具有重要参考价值。

关于大数据理论与概念的研究,中国著名信息管理专家涂子沛在其著作《大数据:正在到来的革命》中比较详细地分析和介绍了大数据的相关概念,并向我们介绍了大数据在美国的应用现状。

关于政府政务数据开放和应用等方面的研究,复旦大学的付熙雯和郑磊,对国内政府信息开放的研究进行了系统的梳理,指出中国的数据开放尚处于起步阶段,缺乏专门研究,但必定是大势所趋(王伟、曹立春,2013)。武汉大学的周志峰与黄如花在《国外政府开放数据门户服务功能探析》一文中,对国外政府数据开放做出相关阐述,指出政府开放数据对于用户来说不具有私有性、免费并可再次使用,具有数据公开合法性、数据格式多样性的特征。湘潭大学王凯伟、周波的《电子政务建设视野中行政监督仿真系统构建研究》提出通过实时数据流实施对行政审批的监督,对建立大数据背景下的行政监督模型提供了参考路径。

关于政府信息失真方面的研究,西安医学院的刘静在《政府信息失真的原因及解决对策》一文中,对政府信息失真的原因做出了比较详细的分析,并提出相关解决对策。

3.国内外研究综述简评

综观国内外研究现状,国外学者关于大数据和大数据在行政管理领域应用等方面的研究开拓了我们的思维,具有很大的启发性,也为中国行政监督领域研究如何更好地应用大数据技术提升行政监督实效提供了参考。但国外学者在弊端研究中,过多地关注隐私泄露和对无罪推论原则的挑战,忽略了对大数据信息失真及其规避问题的研究,不得不提的是,国外学者的很多研究是基于特定环境进行的,在目前的中国并不适用。国内学者也已经认识到在行政管理领域应用大数据技术这一必然趋势,并开展了相关研究,但目前的研究大多是对大数据相关概念的介绍和大数据应用的可行性分析。研究行政管理领域问题的文章较少,且比较浅显,更是缺乏对行政监督数据开放、数据质量及信息失真等问题的研究。而我们为了应对大数据这一发展趋势,大量的研究问题还需亟待解决。

一 大数据背景下行政监督信息面临着新的问题

(一)大数据时代对行政监督信息提出更高的要求

大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到采集、管理、处理,并整理成为能够帮助企业经营决策的信息。在《大数据时代》一书中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。一般认为,大数据具有大量、高速、多样、价值这四个基本特点(于施洋、王建冬,2013);行政监督是指由国家机关、社会团体(包括政党)或个人对国家行政机关及其公务人员所进行的约束、检查、督促,其目的是增强行政人员的“公仆”意识,防止他们滥用职权,从而保证行政机关正常履行职责,提高行政效能(王书伟,2013)。

行政监督信息是指行政监督主体在进行行政监督过程中收集、加工、处理、分析、整理、储存和传递的所有围绕行政监督的相关信息,完善的行政监督信息是行政监督有效开展的基础,也是进行行政监督分析、决策和处理的依据,行政监督信息是否真实有效,直接决定了行政监督活动开展的质量。大数据技术在短短几年内迅猛发展,已经成为一种不可逆转的潮流,大数据时代已经到来。目前我国相关部门也越来越认识到大数据的重要性,并积极探索大数据技术在行政管理领域的应用,其中,在行政监督领域的应用是其重要的组成部分。但我们也应该清醒地认识到,因为大数据自身的一些特性,使大数据在行政监督领域应用时,对行政监督信息提出更高的要求,这些要求主要体现在三个方面。

(1)更为开放的基础数据。大数据技术是建立在对海量数据相关性分析基础上的,所以,数据是大数据技术的核心基础。巧妇难为无米之炊,如果没有真实可靠的行政监督信息,就无法发挥大数据技术在行政监督领域的应用实效。在大数据还未到来的时候,政府相关数据都是以信息公开的形式发布,是一条一条的,但随着大数据时代的到来,这种数据量已经远远不够,现在需要的是政府将自己的政务数据以开放数据库的形式一片一片的开放,为大数据技术在行政监督领域的应用提供数据基础。

(2)更为真实的数据内容。在先前政府公开或上报的统计数据中,因受错误政绩观、个人或部门私利的影响,数据水分很大。这些虚假数据在先前小范围内也许不能产生太大的影响,但大数据是在巨大数据容量下进行的分析,当大量虚假数据掺杂其中的话,必定对正确结果产生干扰。

(3)更为有效的实时数据。在目前政府部门公开的有限数据中,大部分是如季度总结、年度总结这样以时间节点公开的数据,导致有些珍贵的数据随着时间的流逝而失去了应有的价值,造成了信息滞后。而大数据技术一个重大的进步就是通过先进的软件和硬件设施,实现对数据流的实施监控,在第一时间发现问题。这就需要对政府提出更高的要求,将相关数据实时上传,来保证信息的真实性。

(二)大数据背景下的行政监督信息失真问题较为严峻

信息失真是指信息在传递过程中出现偏离信息源发出的真实信息的现象,而行政监督信息具有信息的一般特征,行政监督信息失真是指与行政监督相关的信息在收集、处理、储存、传递的过程中由于主客观因素的影响而发生的与信息原始状态相背离的情况。行政监督信息失真一般表现为虚假信息、不对称信息、信息缺失、信息遗漏、信息滞后等多种形式。

中国行政监督信息失真的问题由来已久,也一直没有得到有效解决,大数据时代的到来,为行政监督信息的真实性提出更高的要求,大数据背景下行政监督信息失真问题比以前更加严峻。目前国内,不仅仅缺乏大数据应用于行政监督的法律法规和制度,更缺乏最基本的保证行政监督信息公开和信息质量的法律法规;同时,由于法律法规的缺失和各种利益相关因素,政务数据封闭,虚假信息泛滥,有效的行政监督信息无法获得和查阅,导致大数据缺乏必要的基础数据;而国内传统的行政监督信息处理方式十分落后,大数据技术起步又晚,缺乏核心技术,无法在短时间内建立行政监督的相关模型,也无法有效地使大量数据在第一时间内进行处理,导致了行政监督信息利用率较低和信息滞后。以上种种原因,都不同程度地导致了大数据背景下行政监督信息失真问题的存在,造成了大数据背景下行政监督信息失真形势的严峻,影响了大数据在行政监督领域应用的实效,使信息失真成为大数据背景下行政监督信息一个必须面对的挑战。其中,大数据背景下行政监督信息失真的表现主要体现在三个方面。

(1)信息不对称。在大数据背景下的行政监督中,与监督主体相比,监督客体因为自身数据封闭等原因,行政监督主体缺乏对监督客体进行监督的基础数据,造成了主体与客体之间的信息不对称。

(2)信息虚假。大数据技术应用于行政监督领域时,可供分析的基础数据不仅数量不足,而且数据水分也很大,加上技术不成熟和人为干扰因素的存在,导致了行政监督虚假信息的存在。

(3)信息滞后。因国内相关政务数据普遍采用年度或季度为时间节点的数据方式,导致无法对与行政监督相关的数据流实现实时监控,使一部分数据失去了原有的时效价值,导致了行政监督信息的滞后和信息利用率降低。

(三)积极应对大数据背景下行政监督信息失真带来的挑战

国外发达国家十分重视大数据技术的应用与发展,认为大数据是继“信息高速公路”之后的又一次信息技术革命。虽然大数据技术在中国的发展仍存在许多困难,但我们要积极面对大数据带来的挑战。在行政监督领域,发挥出大数据技术的潜在力量,提升行政监督实效。其中,在大数据背景下行政监督信息失真问题上,我们应该拿出巨大决心和勇气,从各个角度各个方面深入挖掘大数据背景下行政监督信息失真的原因,并结合中国国情与大数据自身特点,提出科学有效的解决对策。

积极应对大数据背景下行政监督信息失真带来的挑战,就必须系统学习大数据相关知识,树立和培养数据意识,积极应对和消化大数据给我们带来的思维转变;完善相关法律法规,制定适应大数据发展的专项法律,并用法律来保证行政监督信息的公开和质量;改变传统行政监督信息的处理方式,不断提高大数据的应用水平,提高信息的利用率。另外,还要加大对大数据技术的扶持力度,积极开发大数据在行政监督领域的应用模型,并积极培养中国自己的大数据人才。

积极应对大数据背景下行政监督信息失真带来的挑战。规避信息失真,不仅可以更好地提升行政监督实效,还有利于响应十八届三中全会精神,加强反腐败的机制创新,健全惩治和预防腐败体系。另外,把大数据这种新兴技术应用到行政监督领域,本身也是推动国家治理能力和治理体系现代化的有益尝试。

二 大数据背景下行政监督信息失真的主要原因

(一)数据意识薄弱,缺乏良好的数据应用环境

互联网和手机都是数据的重要来源,中国互联网用户和手机持有量都已经成为世界第一位,互联网用户是美国的两倍,手机用户是美国的三倍,但2010年中国新增数据量却不及美国的1/10。不难发现,中国不是缺乏可供搜集的数据,也不缺乏存储数据的手段,而是缺乏相关数据意识。在行政监督问题上,人们更多关注的是政府政策性的文件而不是政府相关的政务数据;更多关注的是政府官员的生活作风而不是其个人相关经济数据。在预防贪污腐败问题上,我们尚缺乏在数据分析基础上的腐败预防监督,很难从官员数据的相关性分析中主动发现问题。数据意识的薄弱,影响了大数据在行政监督领域应用,造成了行政监督信息失真。

(二)法律法规缺失,大数据应用缺乏法治保障

西方发达国家纷纷制定了与数据相关的专项法律来保障数据的开放和数据的质量。其中美国在2007年制定了《开放政府法》来保证政府政务数据的开放,同时制定了《数据质量法》来保证数据的正确性和权威性,而目前我国关于数据开放、数据质量以及其他数据相关法律几乎处于空白。在数据开放方面,国内尚没有一项专门法律来规定政务数据是否开放、何时开放、如何开放等核心问题。这就使大数据技术应用于行政监督领域时缺少法治基础;在数据产权所有方面,国内没有专门法律来规定政务数据的产权到底归谁所有,这不仅影响了政务数据的开放,也影响了行政监督信息共享平台的构建;在数据质量方面,国内也没有像《数据质量法》这样的专门法律来保证政务数据的质量,致使虚假数据泛滥。因为法律法规不健全,缺乏数据质量的具体条款,也缺乏相应的惩处措施,所以政府与官员相关的政务数据水分很大,缺乏可信性与权威性,致使大数据技术在虚假数据的基础上失去真实性。法律法规的缺失,严重制约了中国政务数据的开放、数据质量和大数据技术的发展,使大数据技术在行政监督领域应用时无章可循,数据开放和数据质量也得不到法律保障,造成了大数据背景下行政监督信息的失真。

(三)政务数据封闭,虚假数据泛滥

数据是大数据技术的基础,没有足够数量和足够准确的基础数据,大数据技术就无法发挥实效,容易产生信息的失真。尽管国家逐步推行政府“三公经费”和官员个人财产的申报与公开,但官员的个人财产申报制度还仍然处于商议阶段,“三公经费”也只是政府政务数据的一小部分,大部分政务数据由于数据缺失、利益相关和害怕被监督等原因,被冠上“国家机密”的标签,拒绝对外公开。而已公开的数据也都比较浅显,不敢触及核心数据,造成了严重的信息不对称。随着信息化技术的发展,国家许多部门已经建立了自己的数据库,例如公安部拥有全国规模的人口数据库;审计署也拥有各级政府审查的相关数据,这些都是行政监督信息的重要来源,但目前这些部门的数据库都是各部门的“私有财产”,不仅不对公众开放,政府机关内部也缺乏信息共享机制,不同部门之间很难查询,这就导致了信息被分割,形成了“信息孤岛”。公民无法查阅这些数据,不仅侵害了公民的知情权,还丧失了对政府及其工作人员监督的能力;而行政监督机关也无法对这些分割成块的行政监督信息进行有效整合。分割的信息难免会造成信息的失真。

中国在政务数据的准确性问题上,也一直存在很大问题。一些政府官员为了政绩与升迁,直接干预相关统计数据,并对其进行虚假美化;有些部门并没有及时搜集相关政务数据,为应付上级领导和相关部门审查,突击制造虚假数据。这些虚假数据导致大数据技术无法在正确数据的基础上进行相关分析,分析结果也必将失去真实性。

政务数据的封闭与政务数据的虚假,使大数据技术在行政监督领域发挥作用时缺少可靠有效的数据基础,无法对数据进行有效整合并进行相关性分析,更无法在可靠有效数据的基础上进行预测与预警,造成了大数据背景下行政监督信息的失真。

(四)数据应用水平低,无法发挥大数据技术实效

尽管目前世界范围内大数据技术的使用红利都来自数据的开放,但不要将大数据仅仅等同于开放数据。数据是大数据的核心构成,大数据真正的价值在于对数据流的实时监控和在对数据有效整合基础上进行的相关性分析,从而达到发现问题和预测预警的目的。英国大数据专家维克托在其著作《大数据时代:生活、工作与思维变革》中,就明确指出:大数据给我们带来的三个变革是“要全体不要抽样、要效率不要精确、要相关不要因果”。要效率指的是对数据流的实时监控,避免因信息滞后导致信息失真;要相关不要因果指的是从大量杂乱无序的数据中发现事物的相关关系,而不去追寻之间的因果。目前国内关于大数据的认识主要还停留在数据开放问题上,忽视了对数据的深加工处理,影响了大数据实效的发挥。大数据的应用可以对实时更新的数据流进行实时监控和监督,可以在第一时间预测并发现存在的问题,使其尽快得到解决。但目前国内公开和开放的政务数据,很多都是以年度总结和年度汇报的形式发出,许多数据已错过应用实效,失去了原有的应用价值,从而导致了大数据背景下行政监督信息的滞后。另外,国内公开和开放的政务数据都是某一领域条块化的数据,缺少对不同领域和不同数据库的重叠整合分析,导致难以发现不同数据之间的关系,从而进一步导致无法发现其中存在的问题。大数据应用水平较低,无法通过大数据技术对行政监督相关数据流进行实时监控和监督,导致了行政监督手段的滞后,也造成了大数据背景下行政监督的被动。

(五)技术条件不成熟,缺乏数据处理的专业设备和专业人才

大数据能够在近几年迅速兴起,并广泛被世人接受,除了数据本身已经积累到一个前所未有的数量和数据意识不断觉醒两个原因外,大数据技术的不断成熟也是重要推力之一。美国之所以能够走在大数据应用的前列,除了数据意识较强以外,依靠的就是强大的科技基础。美国政府拿出巨额资金来促进大数据相关技术与设备的研发,而像谷歌、IBM这样的科技巨头公司也依靠自己的科技和人才优势大力发展大数据技术。而在国内,尽管一些发达地区已经陆续部署大数据产业,但技术、设备和人才都与国外有较大差距,技术条件还不成熟,没有掌握核心科技。在技术层面,目前国内云计算平台技术和数据预处理技术掌握程度十分有限,还无法对行政监督相关数据流实施实时监控,也还没有掌握新型数据发掘和分析技术,使视频、音频以及网络的非结构化数据无法被利用;在设备层面,还没有研发出空间大、速度快的新型硬件存储技术和一体化的数据存储服务器;在人才层面,国内也没有培育出专门的“大数据工程师”,大数据人才奇缺。在行政监督领域,因为技术条件所限,还没有办法建立大数据背景下行政监督的系统模型,而系统模型的缺失,会导致数据的采集与应用杂乱无序,得到的分析结果也会与事实产生偏差,不具有参考价值。同时,这些技术条件也同样制约着政务数据的开放和数据的应用水平,最终也将制约大数据在行政监督领域应用的实效。

三 规避大数据背景下行政监督信息失真的对策

(一)转变思想观念,优化大数据应用的制度环境

美国已经把大数据技术看作“信息高速公路”之后的又一次科技革命,并把大数据上升为国家战略。国内的广东和重庆也先后制定了地区性的大数据发展战略,但如果想真正改变中国数据意识薄弱的现状,增强对数据重要性的认识,就必须把大数据的发展上升到国家层面,为大数据的应用提供一个良好的制度环境。首先,应该借助中国深化行政体制改革的机会,尝试着从国家顶层设计的层面促进政务数据的开放,并确定大数据技术在行政管理,特别是行政监督领域改革中的重要作用;其次,大数据技术作为一种先进技术,也与十八届三中全会的总目标“完善和发展中国特色社会主义,推动治理能力和治理体系现代化”相契合,大数据技术的应用,是治理能力提升的一个重要途径和重要手段;最后,还应该制定大数据的国家发展战略,并建立国家层面的数据管理专门机构。只有为大数据在行政监督领域的发展创造一个良好的制度环境,才能使大数据更好地为提升行政监督实效而服务,减少行政监督信息的失真。

(二)完善法律法规,保证数据的开放性和准确性

法律法规是各种规章制度中最有权威性和最具执行力的一种,要想推动大数据技术不断向前发展、政务数据的有效公开和数据的准确性,减少大数据背景下行政监督信息的失真,就必须构建相应的法律法规体系。在大数据发展层面上,国家必须制定全国性的法律法规,统一部署全国范围内的大数据发展,改变目前各地区大数据发展欠佳的现状。同时,也要以法律法规的形式制订政务数据搜集、存储和处理的统一规范标准,避免在大数据应用中各自为政,产生多套标准,以至信息不能共享互通;在数据开放问题上,国家应进一步对先前制定的《中华人民共和国政府信息公开条例》进行完善和修改,加大政府信息公开力度。同时,也应该制定政务数据开放专项法律,以法律的形式保证政府及其工作人员的政务数据能够开放,并对何时开放、如何开放、由谁开放、哪些数据可以开放、哪些数据必须开放等具体问题加以法律约束。明确数据开放中的各项权责,对拒绝开放、拖延开放、部分开放的责任主体实施处罚;在数据质量问题上,也应该积极借鉴国外先进经验,制定专门法律,对开放数据的内容、层次和准确性做出明确规定,并对制造虚假政务数据的行为进行严厉打击,以此来保证数据的质量。其他方面,还应该制定相关法律法规,明确政务数据的产权所有,避免政务数据在行政监督应用中产生产权纠纷和泄露国家机密。目前这些相关法律在国内几乎处于空白,我们必须加快步伐,完善相关立法,以法制来保证大数据技术标准的统一规范、政务数据的开放和政务数据的质量,并以此来规避大数据背景下行政监督信息失真问题的发生。

(三)开放政务数据,建立行政监督信息共享平台

实现政务数据的逐步开放。在大数据背景下,开放数据和公开数据是两个不同的概念,公开是信息层面的,是一条一条的;而开放是数据层面的,是一片一片的。“政府信息公开”是“政府数据开放”的前提和基础,因为目前中国政府信息公开刚刚起步,所以不要奢望在短时间内就能开放无须授权、无差别的政府原始数据。政务数据的开放应该逐步进行,在政府信息公开的基础上,首先开放政府工作和与民生相关的数据,其次再深入开放与政府财政相关的核心数据。还应借鉴其他国家的优秀经验,建立政务数据开放的门户网站,将需要公开的政务数据实时上传并提供下载,供民众和社会组织等监督主体实时监督。

建立行政监督信息共享平台。要想规避大数据背景下行政监督信息的失真,就必须拥有足够数量的准确数据和不同类型的数据库来进行数据的整合、比对、分析。为解决这一问题,就必须改变先前固有的观念,打破政府各部门之间的信息壁垒,消除“信息孤岛”现象,重造政府流程,建立各政府部门之间的数据与信息的共享平台。在共享平台中,各部门之间都应遵循统一的数据标准和数据交换格式,将自己的数据及时上传,其他部门可以在第一时间进行查询和使用。这不仅大大增加了大数据背景下行政监督数据的数量,还可以使行政监督部门通过对不同数据库的比对、分析,发现单个数据库难以发现的问题。建立信息共享平台,不仅有利于增加数据的数量,还可以提升政务数据的质量。一种类型的数据是孤立的,难分对错,但不同类型的数据整合在一起,就可以互相支持、互相验证,让虚假数据无处藏身。信息共享平台的构建,就提供了这样一个不同数据库之间比对验证的平台,这有利于提升政务数据的质量,规避虚假数据造成的错误分析和信息失真。

(四)提升应用水平,使数据创造更大价值与效益

目前国内大数据应用面临着两个问题,一个是数据开放,另一个就是在数据开放基础上的数据应用。要想规避大数据背景下行政监督信息的失真,就必须从开放和应用两个方面入手,不仅要做到开放数据,建立行政监督信息共享平台,还必须进一步提升行政监督数据的应用水平,对数据本身的潜在价值进行更深层次的挖掘,通过对非结构化数据的应用,提升实时数据处理水平,减少信息滞后,加强不同数据库的横向对比等方面来使失真信息无处可藏,进一步推动行政监督数据在提升行政监督实效中发挥更大的价值与效益。

加强对非结构化行政监督数据的搜集和运用。随着网络信息技术的不断发展,结构化且能适用于传统数据库的数据只占数据总量的5%,如果不能很好地对95%的非结构化数据进行搜集和运用,我们将丧失绝大多数的信息来源。所以要想提升行政监督数据的应用水平,应首先加强对非结构化行政监督数据的主动搜集,并通过统一的标准,将视频、音频、网络信息特别是社交网络信息转变为数据库可以识别的数据形式,并把这些数据与结构化数据一道进行分析。

提升对实时数据的处理水平。要想进一步完善大数据技术对政务数据的实时监督,应首先保证政务数据的同步上传。政府以及政府工作人员产生相关数据的同时,数据就已经上传到数据处理系统,并通过数据的清洗和预处理技术,在第一时间对数据进行分析并得到初步分析结果。这样一来,就可以充分发挥数据的时效价值,避免因信息滞后导致的信息失真。同时,提升数据的实时处理水平,也可以在萌芽状态发现相关问题,避免问题的进一步扩大。

加强对不同数据库之间的比对分析。某一类型的数据可能是片面的,无法反映出具体问题,但当把这种数据与其他多种不同类型的数据进行整合、比对、分析之后,就可以通过事物的相关关系发现存在的问题,这在行政监督领域同样适用,美国的阳关基金组织就把白宫访客数据同游说人员的捐款数据库、知名人物社会关系数据库、维基、谷歌等数据库进行了比对分析,来判断医疗保险行业的经理是否通过政府对医疗体制改革进行了干预。但如果只对白宫访客记录单独进行数据分析的话,很难发现相关问题。所以我们要在行政监督信息共享平台的基础上,对不同数据库的数据进行相关性分析,发现先前难以被发现的问题。

进一步提升行政监督预测预警的准确性。预测是大数据的核心,但预测难免会产生失误,我们应该以更加严谨的态度和更加完善的技术来对待政务数据分析基础上的行政监督预测预警,切勿在数据分析的基础上急于做“有罪推定”,以此来规范和保证行政监督信息的准确性。

(五)加强技术创新,为大数据应用提供硬件保障

如果没有强大的技术作为硬件保障,大数据只能作为一个“热词”和“新兴概念”存在于社会当中。如果想要规避大数据背景下行政监督信息的失真,提升行政监督实效,就必须加强大数据技术创新,为大数据在行政监督领域的应用提供更多的可能性和更多的保障。

大数据是一个庞大的系统工程,单个企业与部门很难拥有大数据技术发展的财力和物力,所以大数据技术的创新研发必须依靠国家和政府牵头,并发挥社会各界的资源优势。在国内,重庆市和广东省走在了大数据战略的前列,分别对大数据在行政管理领域应用的技术创新进行扶持。《重庆市大数据行动计划》明确规定要突破云计算平台、海量数据存储、数据预处理、新型数据挖掘和分析等一批大数据关键技术的瓶颈并加快大数据产业发展,完善大数据生态产业链,建立大数据产业基地。同样的,在广东的大数据发展中,中山大学正在创建“超级计算机中心”来辅助广东大数据战略,形成了政府与高校等科研机构合作的模式。这些优秀模式,值得其他地区借鉴和学习。在大数据人才方面,既要引进吸收国外优秀人才,也要加紧培养中国自己“大数据工程师”,为中国大数据发展贡献力量。在传统措施之外,还应该积极借鉴国外优秀经验,通过政府拨款来扶持数据开源社区、程序员协会等民间组织的建设与发展,举办应用程序开发大赛,向全社会征询数据使用、创新的意见,并对优秀程序给予奖励。这些措施都可以很好地推动大数据技术的不断创新,推动大数据的发展。

中国行政监督部门应该顺应时代发展潮流,在各地区制定大数据发展规划的同时,积极谋划行政监督领域大数据技术的应用问题,制定相应的发展规划,积极研发行政监督特定系统配套的软件和硬件,培养行政监督领域的大数据工程师。当大数据关键技术得的一定的突破,数据搜集、存储、处理的硬件设施得到完善,大数据技术人员比较齐备的时候,就可以更好地搜集和开放政务数据,对行政监督数据流实时监控,分析政务数据之间的相关关系,建立大数据背景下行政监督系统模型,从而有效避免大数据背景下行政监督信息的失真,提升行政监督实效。

四 结语

本文的选题立足于“大数据”这一新兴概念,并与所学专业相结合,希望能在大数据方兴未艾之时,对大数据在行政监督领域应用的相关问题进行一定的探讨。在文章中,首先对大数据自身特点进行了分析,并结合大数据在国内行政监督领域应用现状,指出大数据背景下行政监督信息失真是大数据技术应用于行政监督领域的一个重要挑战,严重影响了大数据技术应用实效,必须优先得到解决。在文章的后半部分,就着重从各个角度,各个方面分析了大数据背景下行政监督信息失真的原因,并在中国国情的基础上,借鉴外国先进经验,提出大数据背景下行政监督信息失真的规避措施。本文对规避大数据背景下行政监督信息的失真、提升大数据在行政监督领域应用水平、进一步提升行政监督实效,具有积极的现实意义。

本文在写作过程中还存在许多不足,因资料匮乏,找不到相关具体案例来进行分析,所提出的方案和对策也比较宽泛,缺乏深入具体的研究,希望这些问题能在今后的学习过程中得到相应的改善和解决。

参考文献

陈奇星,2008, 《行政监督新论》,国家行政学院出版社。

《重庆市人民政府关于印发重庆市大数据行动计划的通知》,重庆市人民政府公报,2013。

何承文,2012, 《官方统计数据失真问题研究》, 《中山大学研究生学刊》(社会科学版)第2期。

刘静,2012, 《政府信息失真的原因和解决对策》, 《四川图书馆学报》第4期。

涂子沛,2012, 《大数据:正在到来的数据革命》,广西师范大学出版社。

王凯伟、周波,2011, 《电子政务建设视野中行政监督仿真系统构建研究》, 《档案学通讯》第3期。

王书伟,2013, 《大数据时代政府部门间信息资源共享策略研究》,硕士学位论文,吉林大学。

王伟、曹立春,2013, 《大数据时代的政府信息公开》, 《华北电力大学学报》(社会科学版)第5期。

王云庆、刘佳慧,2013, 《大数据时代背景下我国电子政务创新模式》, 《党政干部学刊》第12期。

维克托·迈尔-舍恩伯格、肯尼斯·库克耶,2012, 《大数据时代:生活、工作与思维的大变革》,周涛译,浙江人民出版社。

于施洋、王建冬,2013, 《政府网站分析进入大数据时代》, 《电子政务》第8期。

周志峰、黄如花,2013, 《国外政府开放数据门户服务功能探析》, 《情报杂志》第3期。

责任编辑:李小军