3.2 国内大数据现状
未来的企业一定是数字化的。当企业把业务从线下搬到了线上,和客户的连接已经开始了数字化的旅程,所有的沟通过程都会被记录,使得企业对用户的了解前所未有的细致和全面。或许某一天,一个客户来到你的公司,你会说:“根据你在淘宝、京东和其他场所的消费习惯和信用,本企业对你的欢迎指数是16.8%”。想想看,这是多么可怕的事情。从商业上说,企业可以通过对海量的用户数据分析来完善产品或服务。未来的竞争一定是面向数据的竞争,数据累计得越多,你对用户越了解,你的业务就越具有独特性,别人难以复制。
未来的政府也一定是数字化的。政府层面对大数据分析应用可以完善公共服务。比如,一个地区的地方政府能够掌握新生婴儿的出生数量、分布区域、未来的入学需求等数据,就可以预测几年之后当地对于学校等教育资源的供给是否足够。政府部门的大数据部门的一个目标是预警,通过应用大数据来进行社会治理,从而为当地百姓提供更好的服务。
最近几年,大数据理念在国内已经深入人心,人们对大数据的认识也更加具体化,“用数据说话”已经成为国内很多人的共识,大数据分析和大数据建设被各行各业所重视,数据成为堪比石油的战略资源。对应石油产业中的油田、冶炼和消费三个环节,数据产业主要包括数据源、加工以及应用三大类。今天的大数据生态就是想让数据来源更丰富,让数据加工更高效,让数据应用市场更广阔。大数据实践逐渐落地,国内的大数据产业政策日渐完善,技术、应用和产业都取得了非常明显的进展。
3.2.1 政策持续完善
在顶层设计上,国务院《促进大数据发展行动纲要》对政务数据共享开放、产业发展和安全三方面做了总体部署。数据共享开放方面的《政务信息资源共享管理暂行办法》、产业发展方面的工信部《大数据产业发展规划(2016-2020)》、数据安全方面的《中华人民共和国网络安全法》等也都已出台。卫计、环保、农业、检察、税务等部门还出台了领域大数据发展的具体政策。此外,17个省市发布了大数据发展规划,十几个省市设立了大数据管理局,8个国家大数据综合试验区、11个国家工程实验室已启动建设。可以说,适应大数据发展的政策环境已经初步形成。
从时间上看,最早成立的是广东省大数据管理局,而级别最高的则是贵州省大数据发展管理局,它是省政府直属的正厅级部门。此外,因与阿里合作而备受瞩目的杭州市数据资源管理局也是大数据的政府部门。各地设立的大数据部门的名称各不相同,有些叫大数据管理局,如上述的广东省大数据管理局、贵州省大数据发展管理局;有些叫数据资源局,如杭州市数据资源管理局、合肥市数据资源局;还有一些名字,如佛山南海区的数据统筹局、江门市的网络信息统筹局、铜陵市的信息化管理办公室、成都市政府的大数据办等。由于各级省市政府对大数据部门的定位不同,这就造成了各个地方大数据部门的职能侧重、级别、隶属关系等各不相同。在这些大数据部门中,大部分隶属于各省市的工信委或经信委,另一部分挂靠在当地政府,或由省、市政府直接管辖。一般隶属于经信委、工信委的大数据部门会更加偏重于产业方面的大数据工作,而直接隶属或挂靠于各级省市政府的大数据部门可能会更加侧重于政务数据工作的开展以及社会治理的推进。
3.2.2 技术和应用逐步落地
开源给国内大数据产业界提供了一个跳板,让我们与国际上大数据技术水平的差距不断缩小。在海量数据分布式存储、计算任务切片调度、节点通信协调同步、数据计算监控、硬件架构等方面,国内不少企业都具备一定的技术水平。与此同时,国产化的商用大数据平台产品正在崛起,底层技术越来越扎实。
大数据应用逐步落地。在金融领域,商业银行全面部署大数据基础设施,五大国有银行、股份制银行、城商行和农商行已经逐步开始从传统数据仓库架构向大数据平台架构的转型改造过程,基于大数据风控的“秒贷”业务越来越普及,不仅提升了贷款效率,还扩大了普惠金融的覆盖面。在电信领域,中国电信的大数据平台已经扩展到31个省,汇聚全国的基础数据形成“天翼大数据”服务能力;中国联通也实现了数据整合,大数据产品体系已经推出征信、指数、营销等六大产品种类。
围绕数据的产生、汇聚、处理、应用、管控等环节的产业生态从无到有,不断壮大。中国信息通信研究院发布的《中国大数据产业调查报告(2017年)》显示,2016年,中国大数据核心产业(软件、硬件及服务)的市场规模为168亿元,较2015年增长达45%,预计到2020年将达到578亿元。
3.2.3 数据产生价值难
数据产生价值链条长。很多政府部门和企业不知道数据怎么用,或者没有支撑的数据平台。对于它们来说,把数据变成价值的链条是非常长的。从采集、整合到分析,整个链条涉及的部门比较多。涉及业务部门、数据平台部门、数据分析与数据产品部门,而后又回到业务部门,这个链条非常长。这决定了要让数据产生价值很困难。
关于数据变现,有一个更有意思的例子,告诉我们只要合理地使用数据,就可以把“数据产生价值链条长”的问题简化,合理的数据平台有助于缩短这个链条,让数据为企业产生价值。这个例子是:有位风水大师一卦3万多,这位大师是怎么做到的?他在美容院购买女性客户的信息,然后整理这些女性与美容师聊天时透露的信息,之后再做关联整理分析。然后找机会接触这些女性进行算卦,道出你的年龄、家庭、身体状况、是否手术、哪里有痣、兴趣爱好等。这些女性当时就觉得“真神”,之后形成口碑传播,生意红火,真正的数据产生了价值。
3.2.4 问题与机遇并存
从数据的产生端到数据价值链条顶端的决策行动支持,要经过整合、管理、分析、洞察这几个关键步骤,在当前国内的大数据生态中,大数据价值实现的难点和重点在于数据的有效融合和深度分析。
1. 打破数据孤岛
人人都想要别人的数据,但都不愿意把自己的数据给别人,这是目前的数据现状。以前信息系统建设都从一个个“烟囱”开始,数据缺乏互通的技术基础,这是大数据需要解决的第一个大问题。从国家层面到企业内部,情况大同小异。麦肯锡的一份报告显示,大数据在很多领域没有达到预期效果,很重要的原因就是数据割裂。这些年,推动数据开放共享的政策举措一直在加强,政策已经很给力了,但效果与预期还有距离。这时就需要技术来推进。
2. 加强数据管理
数据分析工作往往有80%的时间和精力都耗费在采集、清洗和加工数据上。数据质量不过关,也会让数据分析效果大打折扣,甚至让分析结果谬以千里。很多单位大数据的应用效果不佳,多半问题出在数据管理上。大家都同意把数据当作资产,甚至认为有朝一日数据会计入资产负债表。但对比桌椅板凳这些实物资产,我们对数据资产的管理还处于非常原始的阶段。我们往往对自己的数据资产有哪些、有多少都不清楚,更别说数据质量、数据安全、资产评估、资产交换交易等精细管理、价值挖掘和持续运营了。
然而,数据管理不像数据分析挖掘那么光鲜亮丽,就像城市的“下水道工程”,短期只有投入而看不见产出。但长期又不得不做,这是战略层面的事,当前不做未来返工的成本巨大。以后每个企业都将成为数据驱动的企业,打基础的事情要尽早。
3. 深化领域应用
虽然大数据的应用取得了一定进展,在互联网、金融、电信、交通等领域产生了实实在在的效益,旅游、环保、公安、医疗、工业领域也正在加速发展。但总体上只能说刚刚走出了小半步。一类是“平行替代”,如金融和电信行业用Hadoop来重构原来昂贵的数据仓库;另一类则是“补课”,如政务、医疗、工业、环保等领域,正在做的工作是在原有业务系统之外,新建本来早该建设的数据平台。
这些大数据应用显然还不够高大上,是量变而非质变,但的确也是发展必经的阶段。随着这些“替代”型或“补课”型应用的深入,未来业务与数据将加深融合,越来越多数据驱动的新模式、新业态值得所有人期待。也只有这样,数据强国战略才能落到实处。