第3章
大数据与国家治理的国际经验
3.1 美国
20世纪90年代以来,随着网络信息技术的发展,全球数据量呈现爆炸式增长。美国作为大数据的发源地,引领着全球大数据战略的发展和变化方向。克林顿政府提出的“信息高速公路”计划是美国政府的一项国策,由此引发了计算机信息技术革命,成就了美国作为全球信息产业强国的霸主地位,为大数据战略的部署奠定了基础。美国在联邦政府的支持下,充分发挥20世纪信息高速发展的基础优势,搭建数据开放平台,开展关键技术研究,推动大数据应用,积极结合企业、研究机构等多方资源,逐步推进大数据发展,继续保持其在新信息时代的霸主地位。
1. “信息高速公路”开启美国互联网时代,为其奠定大数据战略发展的基石
1993年9月,美国政府发布了“信息高速公路”计划,又称“国家信息基础设施”计划,由此拉开了信息技术革命的序幕。美国政府发动的这场信息技术革命,使美国完成了由工业时代向信息时代的过渡,建立了以互联网为核心的综合信息服务体系,使社会各方面的运行方式发生巨大转变,人们的沟通、工作和生活方式也有了深刻变革,为美国信息技术的飞速发展奠定了坚实基础,成为美国大数据战略发展的重要基石。
1)构建基于互联网的全域高速信息网络
20世纪末,美国政府宣布实施“信息高速公路”计划,给出了全美境内高速信息网络的构建计划与时间表,并提出了相应的概念、规划和行动纲领。
“信息高速公路”计划的核心是,建设覆盖全美的宽带高速信息网,建立统一的网络应用与维护标准,整合人才、设备等资源,用高速互联互通的信息网络将美国的全部经济单元整合起来,并借此将各种各样的信息准确、快速地传达至全国。构建“信息高速公路”的目的是,有效开发和利用互联网信息资源。对于大众而言,通过这个计划可以在家中享受娱乐、购物等乐趣;对于企业、各级政府及整个社会而言,信息的高速互联互通会带来更多的便利、产生巨大的利益,是国家发展与繁荣稳定的基础性战略资源。
2)构建美国国家信息基础结构
美国“信息高速公路”计划的目标是政府用20年的时间、斥资4 000亿美元,搭建国家信息基础结构,使其成为国家发展重点产业的基础。此举旨在构建高水准的“信息高速公路”,为全人类提供即时信息服务的网络架构,实现即时服务。这个计划需要互联互通的信息可以任意流通并保存,需要互联的信息流有足够的带宽,需要家家户户拥有方便使用的互联网进出通道,需要提供服务齐全的高度智能设备来管理整个信息系统,需要制定一整套的方针政策和管理办法。
2. 沿“信息高速公路”推出数据开放平台,开展数据公开行动
1)从政府的数据开放做起
2009年1月,美国政府出台文件《透明和开放的政府》,呼吁建立一个透明的、具有参与性的、多方协作的“开放政府”;2019年12月出台文件《开放政府指令》,为各行政部门建设“开放政府”提供了行动指南和行动期限,其政策包括在线发布政府信息、提高政府信息质量、建立开放的政府文化并使之制度化、为“开放政府”创造有利的政策框架等。同年,美国推出Data.gov网站,这是美国最重要的政府数据公开平台,也是美国“开放政府”承诺的关键部分。按照数据分类,Data.gov网站共有原始数据集、联邦数据集管理工具和地理数据三个门类。初期,Data.gov网站共开放19万余个数据集、超过38万项地理数据和原始数据,涵盖气候、农业、教育、能源、医疗、金融等约50个门类。与此同时,为方便公民使用、提高数据的透明度,Data.gov网站开发了众多新功能,如高级搜索、网站互动、数据分级评定等;为使公民可以更易找到和使用资源,Data.gov网站还开发了政府API索引,使政府信息更加公开畅通、服务交付更加方便快捷,成为政府与公民进行沟通的渠道和平台;为使各国开发者可以根据自己的需要使用和修改信息,美国政府将网站进行了开源,在GitHub上托管代码,开辟了网络应用界面,发布了上千个应用程序和软件工具,以及包括FEMA、Lose It在内的103个手机应用插件。
2)推行“我的大数据”倡议,提高数据透明度
2010年前后,美国政府开展了一系列主题为“我的大数据”的倡议行动计划。通过这些行动计划,美国公民可以更方便地获取个人数据,从而更好地办理私人领域的各种业务和服务。以下列各个计划为代表,美国政府为公民提供了方便快捷的数据获取渠道,提高了数据的透明度。
(1)“蓝纽扣”计划。美国公民可以通过“蓝纽扣”获得个人健康信息,方便进行自身健康管理。已有3/4的美国公民通过此计划获取了自身健康信息,并进行健康管理。同时,其他用户也可以利用“蓝纽扣”和信息提供方交换数据信息。
(2)“创建副本”计划。美国国税局于2014年建立了“Get Transcript”网站,该网站可为纳税人提供纳税方面的数据。通过该网站,纳税人可以方便快捷地获取个人近3年的纳税记录,下载纳税申报单,进行抵押、贷款等活动。
(3)“绿纽扣”计划。该计划由美国电力行业推出,旨在帮助美国各个企业和家庭能够方便地获取能源的使用信息,从而帮助他们节约能源,降低生产、生活成本。“绿纽扣”计划为美国5 900万个企业与家庭提供了服务。
3)积极立法,提供数据开放的法律保障
2012年2月,时任美国总统奥巴马签署了《网络环境下消费者数据的隐私保护——在全球数字经济背景下保护隐私和促进创新的政策框架》。该框架从官方角度正式提出了《消费者隐私权利法案》,并对其立法背景、理念及法案的所有具体内容进行了详尽、深入的介绍。《消费者隐私权利法案》主要规定了以下3个方面的内容。
(1)“告知与同意”框架的强化。
① 个人控制:所有普通美国人有权控制企业对自身信息的收集和使用。
② 透明度:所有普通美国人有权不受约束地获取和使用有关隐私及其安全保障的信息。
③ 情境一致:所有普通美国人有权要求企业获取及使用私人信息的方式和其提供信息时的情境协调一致。企业获取及使用私人信息需要有特定的目的,且必须与消费者的合理预期及其向消费者公开说明的目的相符,并为了实现这些目的而应用和共享数据[1]。
(2)数据存储及数据处理的安全责任。
① 安全:所有普通美国人有权要求自己的个人数据被安全且负责任地处理。收集个人数据的企业要结合企业以往在个人数据方面的做法,对隐私和安全风险进行评估,务必采取适当的安全措施,防范一切可能产生的风险。
② 接入权与准确性:所有普通美国人的个人数据有误时,数据所有人有权提取及修改以可用格式存储的个人数据,企业在使用个人数据时需要确保数据的准确性。
③ 收集控制:所有普通美国人有权合理限制企业对个人数据的收集和保存。
(3)事后问责制。
问责制:所有普通美国人有权将个人数据交给企业处理,以确保企业遵守有关规定。获取个人数据的企业要事先培训雇员,使雇员在合规情况下使用个人数据,并定期评估绩效。企业需要进行全面的内部控制监督,保证在合理范围内使用数据。在问责制下,企业不但需要在内部进行控制和责任追究,而且需要对执法机构和消费者承担外部责任[2]。
2015年12月,奥巴马签署了《2015年网络安全信息共享法案》,该法案为联邦实体和非联邦实体之间的网络安全建立了自愿共享的网络威胁指标体系和防御措施系统。它要求联邦政府定期公布最佳方案,以进一步保护其网络基础设施;确定联邦政府允许使用的网络威胁指标和防御措施,同时限制信息的披露、保留和使用;授权各实体共享网络威胁指标和防御措施,并提供责任保护。
2019年1月,美国政府于Data.gov网站推出10周年之际颁布了《开放政府数据法案》,使Data.gov网站的“数据公开”由政策变成法律。它要求联邦政府以公开数据的形式在网上发布信息,使用标准化的、机器可读的数据格式公开数据和元数据。此外,该法案要求联邦勤务总署、管理和预算办公室、政府信息服务办公室磋商,建立一个“工具、最佳实践和模式标准的在线知识库”,以促进整个联邦政府的开放数据实践。
3. 一脉延续“信息高速公路”计划,启动“大数据研究和发展”计划
2012年3月,美国政府延续“信息高速公路”计划,发布《大数据研究和发展倡议》,“大数据研究和发展”计划正式启动。该计划由美国国家科学基金会、国防部、国防部高级研究计划局、国立卫生研究院、能源部等政府机构组成,投资额累计高达2亿美元,旨在加快大数据的获取、使用、挖掘与开发利用等技术的研发,提高大数据的使用能力。
1)国家科学基金会:加快发展大数据核心技术
美国国家科学基金会联合国立卫生研究院展开大数据研究,进一步加大对大数据的提取、分析,促进核心算法和技术手段的升级,缩短科技成果产出周期,带领国家进入一些全新的研究领域。
2)国防部:利用数据支持决策
美国国防部每年投资2.5亿美元左右,在国防部内部实施一系列研究计划,将数据获取和决策支持有机结合,建立可以独立操控并做出决策的自治式系统,加强战斗员、分析师对环境的感知力,使任务流程的认可度大大增强。
3)国防部高级研究计划局:联合国防部开展项目合作,借助大数据辅助决策
美国国防部高级研究计划局开展了X-数据项目(XDATA),计划开发出能够分析海量半结构化数据和非结构化数据的计算技术和软件工具。XDATA项目可提供开源码,支持开源软件工具集,帮助开发组织灵活地开发软件,让用户能够拥有庞大的数据处理能力,并与特定国防应用的任务数据流同步。
美国国防部高级研究计划局与国防部开展项目合作(见表3-1),主要合作内容包括推动大数据辅助决策(主要集中在侦察、网络间谍、情报等方面)、建立自治系统、实现操作与决策的自动化等。
表3-1 美国国防部高级研究计划局与国防部开展的大数据项目
4)国立卫生研究院:实现千人基因组计划的免费开放
美国国立卫生研究院免费开放人类遗传变异研究数据集,供研究人员自由访问和使用。至2012年7月时,数据量已经达到约200TB。该数据集规模庞大,应用效果突出。
5)能源部:以先进的计算机基础推动科学发现
2013年,美国能源部投资2 500万美元来建设可扩展的数据管理与分析和可视化(SDAV)的研究所,使用超级计算机对数据流进行操作与处理。由于大数据的规模与复杂性不断增长,对新型工具的需求更加迫切,因此能源部斥巨资进行研发,以提供大数据使用的各种新方法。
4. 推出“数据—知识—行动”,推动大数据技术发展和应用
美国政府于2013年11月提出“数据—知识—行动”计划,进一步细化利用大数据改善国家治理、推动科技创新、提高经济质量、促进经济发展的路径。这是美国向数字化城市、数字化经济、数字化治国及数字化国防转型的重要路径。此外,美国各大互联网信息企业也加入其中,从大数据相关技术和应用等多方面共同推进美国大数据的发展。
1)从数据到知识——大数据计划扩展与延伸
“大数据研究和发展”计划实施的第二年,美国政府积极呼吁各大联邦机构、私人企业、学术单位、州政府、非营利性组织与基金会等,共同发展跨区域大数据创新专案与合作关系。
“大数据研究和发展”计划主要由政策、资源和标准化三部分构成,共享生物医学大数据,开发应用新的分析方法与软件。同时,该计划要求加强对数据科学家、计算机工程师及生物信息学家的专业培训,设立研发中心,以开发一般化方法,解决生物医学分析、计算生物学和医学信息等问题。
2)“数据—知识—行动”——将大数据知识加以应用
白宫科技政策办公室会同美国其他机构,共同合作推动“数据—知识—行动”计划。这个计划的目标是,推动大数据分析技术的应用与支持,增加大数据人力资源的投入,开发、验证、评估大数据关键成果的应用效果,促进各种产业大数据应用在全球的发展,通过大数据获得新的知识见解,并扩展其利用的范围,培育新的发展区域。
政府推动的各项计划,促进了创新应用的发展,对国家经济、公共建设产生了深远的影响。随着新兴科技的快速发展,越来越多生活中的数据,如消费、谈话、社交等,都将被收集、存储、分析与使用,由此衍生了人们对隐私权保护的相关疑虑。究竟哪些数据被政府或私人单位所收集、这些数据又被应用到什么地方,这都是公众所关心的,也是政府面临的一项挑战。
3)结合企业力量,开展大数据关键技术研究
美国能源部、国立卫生研究院等部门先后推出大数据相关项目,加快大数据在国家各层次、各领域的应用及价值开发。信息领域的企业纷纷加入其中,进行大数据关键技术的研究;各大IT巨头积极通过并购实现技术整合,相继推出了不同种类、不同用途的大数据相关产品和服务;同时,出现了Splunk、Clustrix、Junar等大数据新兴企业,IT行业相关的新兴技术发展迅速。
谷歌作为大数据时代的开拓者,建立了世界上最快、最强大、最高质量的数据中心,拥有全球36个超大型数据中心、上百万台服务器,建立了高分辨率的谷歌地图数据库。谷歌自2006年提出云计算概念以来,每年投入约16亿美元用于构建云计算数据中心,目前已经拥有100多万台云计算服务器。谷歌研发的大数据“三核心”——文件系统、处理算法和分布式数据库,打造了全球大数据开发的主流框架和范式。雅虎和Apache软件基金会等机构皆与之合作,通过对谷歌算法思想的拓展,开发了Hadoop开源框架。谷歌街景地图、谷歌无人驾驶汽车等虚拟现实产品的推出,均是基于大数据对位置信息的处理的。正是有了这些大数据,谷歌的虚拟现实之路才更加光明。
5. 发布“大数据”白皮书,推动政府职责创新和商业创新
2014年5月,美国公布了全球“大数据”白皮书——《大数据:把握机会,维护价值》,借助大数据技术最大限度地刺激经济增长、降低风险。此外,美国还开展了“公开数据”行动,先后公开联邦政府50余个部门和门类的数据,以便商业部门查询与使用,支持创新发展。
1)关注大数据对公民的潜在影响,加强政府数据管理
美国政府“大数据”白皮书中的第五部分“迈向大数据的政策框架”,深入分析了大数据与公民、消费者、隐私权及隐性歧视之间的关系。在实践中,大数据有可能造成与国家法律、社会价值观相背离的情况,故而要将由自动化决策产生的歧视性影响更好地检测、计量、纠正、解决,使公共政策与信息技术的结合具备正当性。大数据虽然可能导致歧视现象发生,但也可用来保障公民的自由。“联邦政府涉及公民权利的机构必须能够识别从大量数据分析中得出的不利于受保护阶级的行为和结果,从而开发出一套解决方案,并研究解决相关的违法现象。评价过程中,每个机构还要考虑到数据的层级、信息汇总的语境、信息对象的人口群体和有关群体的立法期待。政府部门应与民权组织合作,使用大数据来确保弱势群体可以有平等的对待。”[3]
2)加强隐私保护执法,提升全球互操作性
与此同时,美国联邦政府及各级州政府加强了隐私保护的执法工作,推进了隐私保护方面的国际合作。2012年,美国政府发布《消费者隐私权利法案》,该法案支持联邦贸易委员会且授予其职权,使其能够为实施行为准则的企业提供更明确的预期。2014年2月,美国政府公布相关立法草案,目的是让消费者更好地保护其在互联网上所留数据的使用、存储和销售,并将2012年出台的《消费者隐私权利法案》上升为法律[4]。
3)推广大数据应用,进行商业创新
(1)打造智慧城市。2009年9月,美国艾奥瓦州迪比克市与IBM合作建立了全球第一个智慧城市。这座城市是一个由高科技充分武装的6万余人的社区。通过采用IBM新技术,迪比克市实现了完全数字化,连接了城市的所有资源,通过检测、分析和整合各种数据,智能化地做出响应,服务于市民的需求[5]。
(2)发展电子地图。谷歌采用大数据方法,基于新的计算机算法,将计算机计算与细致的人工计算相结合,为用户提供更加准确、翔实的地图信息。2014年11月,谷歌发布集成Material Design的新版谷歌地图。Material Design使用了更明亮的颜色和动画,是一个在多个设备和平台提供一致体验的基础架构。当用户打开Android或iOS上的谷歌地图时,可以看到明亮的色彩和全新的设计。新外观是为了反映现实世界的表面和阴影。谷歌地图有新的现实感、层次和按钮设置,以帮助用户明确点击哪里可以方便地获得方向、推荐和图像。
2012年以来,苹果也连续对地图应用进行升级优化,现任CEO库克表示,在地图达到“令人难以置信的高标准”之前不会停止对该应用的调整,而地图升级优化的下一步就是提供室内数据。2015年6月,TomTom和苹果重新签署了地图协议,所以苹果可能会在未来几年提供自家的数据系统。2015年6月,苹果地图还增加了7个国际性都市的3D Flyover模式支持,该模式允许用户查看相关城市的3D渲染图。这些城市的3D Flyover模式不仅能在iOS 8以上设备的地图应用中得到支持,也能在OS X Yosemite的Maps应用中得到支持。
6. 发布《联邦大数据研发战略计划》,为联邦机构大数据项目提供战略指导
2016年5月23日,美国政府发布《联邦大数据研发战略计划》,作为2012年《大数据研究和发展倡议》的延续和补充。该计划旨在构建数据驱动战略体系,基于大数据分析、信息提取及发现和做出决策的能力,激发联邦机构和整个国家的新潜能,加速科学发现和创新进程,并培育21世纪下一代科学家和工程师,促进经济增长。该计划由七大战略组成,主题分别聚焦新型技术、数据质量、基础设施、共享价值、隐私安全、人才培养和加强合作,涉及15个联邦机构,为各联邦机构确定与大数据相关的计划和投资提出指导意见,拟建成有活力的国家大数据创新生态系统。
7. 发布《联邦数据战略和2020年行动计划》,将数据作为战略资源开发
2019年12月,美国白宫管理和预算办公室发布《联邦数据战略和2020年行动计划》,该计划反映出美国对数据的关注由技术转向资产,“将数据作为战略资源开发”成为核心目标。
1)确立了政府范围内的框架原则
在伦理层面,政府机构应基于基本道德规范,评估联邦数据应用实践对公众的影响,确保它服务于公共利益;采取合理的数据安全措施,保护个人隐私,确保适当访问和使用数据;提高透明度,阐明联邦数据应用的目的和用途,建立公众信任。在意识层面,政府机构要确保相关性,保护数据的质量、完整性和可理解性;充分使用现有数据并预期未来用途,注重塑造数据间的互操作性;提高及时响应能力,改进数据收集、分析和传播方式。在文化层面,政府机构应加强数据能力培训,促进与数据有关的学习,确保学习的持续性和协作性;培养数据领导者,分配职责,审核数据实践,建立问责制。
2)确立了40项具体数据管理实践
40项具体数据管理实践可分为3个层面:一是建立重视数据并促进数据共享的文化,如通过数据指导决策、评估公众对联邦数据的价值和信任感知、促进各个机构间的数据流通等;二是保护数据,如保护数据的完整性、确保流通数据的真实性、确保数据存储的安全性、允许修改数据、提高数据的透明度等;三是探索有效使用数据的方案,如提高数据管理与分析能力、促进数据访问的多样化路径等。