白话大数据与机器学习
上QQ阅读APP看书,第一时间看更新

1.1 大数据产业现状

大数据是近几年来都一直非常火热的一个名词,似乎是伴随着“互联网”的逐渐发展所出现的一个新名词。我们在天天听着“互联网+”的同时也在听说“大数据+”。

大数据其实是一个比较抽象和笼统的概念,应该说这个词是为了涵盖性地表达一系列生产和业务行为的一个统称。但是也正是由于这种抽象和过于简略的称谓方式,让每个人都容易对这个词产生见仁见智的不同视角的印象或者看法。

大数据是一个以数据为核心的产业,是一个围绕大数据生命周期不断循环往复的生产过程,同时也是由多种行业分工和协同配合而产生的一个复合性极高的行业。

在我看来,大数据产业生产流程从数据的生命周期的传导和演变上可以分为这样几个部分:数据收集、数据存储、数据建模、数据分析、数据变现

其中每个环节都是非常重要的数据生命环节,每个环节的生产加工行为都是有其价值的,并且每个环节做到极致都可以成就一个伟大的公司。整个完整的产业生态圈就是大数据,它的缩影也渗透在任何一家以数据作为运营基础的公司中。

根据麦肯锡2011年发布的一份研究报告,到2018年世界范围内将会出现高达14万~19万的“大数据”岗位空缺。而艾瑞咨询集团在“2014年会”上曾指出,全球数据量每18个月翻一番,到2015年,中国专用数据分析人员预计缺口1400万。

可以看到,在仅仅三四年的时间间隔上,两家咨询公司做出的预测都很大胆,但是两个估算数字相差也确实非常悬殊。究竟哪个数字更贴近“事实”并不好判断,因为大家对“大数据”的概念边界理解可能有很大的偏差,估算出现偏差是必然的,但是有一点可以肯定,大数据人才缺口一定是未来几年非常显著的问题。

2015年12月21日,全球第一家大数据交易所——贵阳大数据交易所经过半年多的发展,交易金额已突破6000万元人民币,会员数量超过300家,接入贵阳大数据交易所的数据源公司超过100家,数据总量超过10 PB,已发生实际交易的会员超过70家。预计在未来3~5年,交易所日交易额将突破100亿元 来自《新华网》的报道。

截至目前,中国境内除了贵阳大数据交易所以外,还有长江大数据交易所、东湖大数据交易所、崇州大数据交易所等十余家大数据交易所挂牌营业。

2016年1月,阿里云的“数加”大数据平台和金山云的KMR平台等国内大品牌云产品供应商的重磅产品先后登场,几乎所有有远见的云产品巨擘资本都在向大数据产业链集中。但是这块蛋糕似乎有点太大了,只能边烘焙边分割,谁也没办法一下子全吃掉。