1.1.1 大数据的发展历程
大数据的发展历程一般可以划分为5个阶段,即大数据出现阶段、大数据初级阶段、大数据热门阶段、大数据时代特征阶段、大数据爆发期阶段。
1.大数据出现阶段(1980—2001年)
著名未来学家阿尔文·托夫勒所著的《第三次浪潮》中将“大数据”称为“第三次浪潮的华彩乐章”。1997年,美国国家航空航天局的两位研究员迈克尔·考克斯和戴维·埃尔斯沃斯在第八届可视化会议上首次使用“大数据”一词,其用来描述模拟飞机周围的气流——是不能被处理和可视化的,因为其数据集通常非常大,超出了主存储器、本地磁盘,甚至远程磁盘的承载能力,称之为“大数据问题”。
2.大数据初级阶段(2002—2008年)
在“9·11”事件后,美国政府为阻止恐怖主义,开始涉足大规模数据挖掘。美国国防部整合现有政府的数据集,组建了一个集合通信、犯罪、教育、金融、医疗和旅行等记录来识别可疑人的大数据库,但一年后该数据库停止使用。大数据在云计算出现之后才凸显其真正价值,谷歌在2006年首次提出云计算的概念。2007—2008年,随着社交网络的激增,大数据的概念被注入新的生机。2008年9月,《自然》杂志推出了名为“大数据”的封面专栏。
3.大数据热门阶段(2009—2011年)
2009—2010年,“大数据”成为互联网行业的热门词汇。2009年,印度建立了用于身份识别管理的生物识别数据库,联合国全球脉冲项目研究了如何利用手机和社交网站的数据来分析预测疾病暴发之类的问题;欧洲一些领先的研究型图书馆和科技信息研究机构建立了伙伴关系,致力于改善在互联网上获取科学数据的难度。2010年,肯尼斯库克尔发表大数据专题报告《数据,无所不在的数据》。2011年,IBM的沃森计算机系统在智力竞赛节目《危险边缘》中打败了两名人类挑战者,《纽约时报》称这一刻为“大数据计算的胜利”。2011年6月,麦肯锡发布了关于大数据的报告,正式定义了大数据的概念,并逐渐受到了各行各业的关注。2011年11月28日,工业和信息化部发布了《物联网“十二五”发展规划》,将信息处理技术作为4项关键技术创新工程之一提出,其中包括海量数据存储、数据挖掘、图像视频智能分析,这些是大数据的重要组成部分。
4.大数据时代特征阶段(2012—2016年)
《大数据时代》一书中将大数据的影响分为3个不同的层面,分别是思维变革、商业变革和管理变革。“大数据”这个概念乘着互联网的浪潮在各行各业扮演了举足轻重的角色。
2012年,大数据被越来越多地提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。数据正在迅速膨胀,随着时间的推移,人们越来越意识到数据的重要性。
2012年1月,在瑞士达沃斯世界经济论坛上发布的《大数据 大影响》宣称,数据已经成为一种新的经济资产类别。2012年,美国奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,标志着大数据已经成为重要的时代特征;2012年3月22日,奥巴马政府宣布投资2亿美元在大数据领域,这是大数据技术从商业行为上升到国家科技战略的分水岭。2011年,韩国提出了“大数据中心战略”;2012年,美国颁布了《大数据的研究和发展计划》;2013年6月,日本发布了《创建最尖端IT国家宣言》;2013年10月,英国发布了《英国数据能力发展战略规划》;世界上其他一些国家也制定了相应的战略和规划。2012年7月,联合国在纽约发布了《大数据促发展:挑战与机遇》,总结了各国政府如何利用大数据更好地服务和保护人民。2012年7月,为挖掘大数据的价值,阿里巴巴在管理层设立“首席数据官”一职,负责全面推进“数据分享平台”战略,并推出大型数据分享平台——“聚石塔”,为天猫、淘宝平台上的电商及电商服务商等提供数据云服务。
2013年被称为中国的“大数据元年”,大数据因互联网和信息行业的发展而引起人们关注,并开始在我国逐渐展开应用,在社会的各个领域探索与落地实践。阿里巴巴于2013年1月1日转型重塑平台、金融和数据三大业务,阿里巴巴是最早提出通过数据进行企业数据化运营的企业。2013年,在全球70个开放数据国家和地区中,中国仅列第35位。2013年,英国政府宣布注资6亿英镑发展8类高新技术,其中,1.89亿英镑用来发展大数据技术,旨在开放欧盟公共管理部门的所有信息。大数据掀起的变革,对生产力和生产关系产生了重要影响。
2014年,数据开放运动已覆盖全球44个国家。2014年4月,世界经济论坛以“大数据的回报与风险”为主题发布了《全球信息技术报告(第13版)》;2014年5月,美国白宫发布了全球“大数据”研究报告《大数据:抓住机遇,守护价值》。2014年,“大数据”首次出现在我国《政府工作报告》中,设立新兴产业创业创新平台,在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展。2014年8月7日,国务院通过《企业信息公示暂行条例》(国务院令第654号),原则是实现企业信息的互联共享,运用大数据等手段提升监管水平。
2015年9月5日,《国务院关于印发促进大数据发展行动纲要的通知》发布;2015年10月26—29日,党的十八届五中全会召开,提出要实施“国家大数据战略”,这标志着大数据战略正式上升为国家战略,开启了我国大数据建设的新篇章。
2016年12月18日,工业与信息化部正式印发《大数据产业发展规划(2016—2020年)》。据《中国大数据发展调查报告》统计,2016年中国大数据市场规模为168.0亿元,同比增速达到45%。
5.大数据爆发期阶段(2017—2022年)
2017年,在政策、法规、技术、应用等多重因素的推动下,我国基本形成了跨部门数据共享共用的格局。北京、天津、上海、重庆、河北、辽宁、贵州、山西等省市政府相继出台了大数据研究与发展行动计划,展开区域数据中心资源汇集与集中建设。北京、上海、贵阳开展了大数据标准试点示范,全国至少有13个省份成立了21家大数据管理机构,已有35所高校获批“数据科学与大数据技术”本科专业、62所专科院校开设“大数据技术与应用”专科专业,申报“数据科学与大数据技术”本科专业的院校达到293所。
2017年,我国大数据产业发展进入爆发期。《2017中国地方政府数据开放平台报告》《大数据安全标准化白皮书(2017版)》《中国大数据发展调查报告(2017年)》《工业大数据白皮书(2017版)》等陆续发布。2016年12月15日,《“十三五”国家信息化规划》发布。
在2018拉斯维加斯消费电子展(CES)上,美国消费技术协会总裁兼首席执行官加里·夏皮罗、英特尔首席执行官布莱恩·克尔扎尼奇等表示,大数据将对人类生活产生深远影响,大数据是未来科技浪潮发展不容忽视的巨大推动力量。2018年,许多国家都对大数据产业发展展现出高度的热情:美国希望利用大数据技术实现多个领域的突破,包括科研教学、环境保护、工程技术、国土安全、生物医药等,涉及美国国家科学基金会、美国国家卫生研究院、美国国防部、美国能源部、美国国防部高级研究局、美国地质勘探局6个联邦部门和机构;欧盟在大数据方面的活动主要有4个方面,即研究数据价值链战略因素,资助“大数据”和“开放数据”领域的研究和创新活动,实施开放数据政策,促进公共资助科研实验成果和数据的使用及再利用。
2019年,随着互联网发展,全球大数据量呈现爆发式增长,中国数据量增长最迅速,年平均增长速度比全球快3%。大数据产业将不断丰富商业模式,构建多种多样的市场格局,具有广阔的发展空间。2018年,我国产生的数据量约为7.6ZB,美国产生的数据量约为6.9ZB。截至2019年6月,中国网民数量达8.54亿人。2019年12月5日,2019中国(上海)大数据产业创新峰会在上海召开,会议按照“融合创新”的宗旨,围绕大数据产业创新链营造积极、良好的生态氛围。
大数据发展浪潮席卷全球。以美国、英国、韩国和日本为代表的发达国家一向重视大数据在促进经济发展和社会变革、提升国家整体竞争力等方面的重要作用,把大数据视为重要的战略资源,大力抢抓大数据技术与产业发展先发优势,积极捍卫本国数据主权,力争在数字经济时代占得先机。美国实施“三步走”战略,推进大数据产业发展,对大数据应用及其产业发展持续关注,并督促相关部门实施大数据重大项目,构建并开放高质量的数据库。
大数据产业或开源大数据商业化有七大特点:一是开源大数据商业化进一步深化;二是大数据行业分析应用开拓新市场;三是大数据细分市场规模进一步扩大;四是大数据推动公司并购规模和数量进一步提升;五是大数据分析的革命性方法出现;六是大数据与云计算深度融合;七是大数据一体机将陆续发布。
随着全球化进入加速发展期,大数据技术走向“大数据+行业”融合发展阶段。同时,大数据产业保持良好发展势头,渗透、融合到各行业全面发展。其中,互联网大数据与工业大数据的差别和联系如表1-1所示。
表1-1 互联网大数据与工业大数据的差别和联系
续表