一、“互联网+”与大数据
进入新世纪以来,随着互联网对于企业经营的日益渗透和融入,有关“互联网+”和“+互联网”的争论一直持续不断。这既体现了对于互联网的不同理解层次,当然也决定了对于大数据的不同认知理念以及应用方式。
从推动企业变革的意义上看,“互联网+”是基于渠道或平台的颠覆性创新,是基于市场需求导向的供给侧变革,“+互联网”则是传统企业的技术性改进,具有效率改进意义。相比较而言,由市场推动创新相对于由技术改进创新具有更多变革意义,更能形成全新的组织形式和商业模式。
“互联网+”作为以互联网为基础或平台,它首先是一种思维方式,标志着互联网已经从简单的工具快速成为整个社会的基础设施以及发展的核心理念。其次,所谓“互联网+”是以互联网为主的一整套信息技术(包括移动互联以及智能互联、云计算、大数据等)在经济、社会生活各部门的扩散、应用,并不断释放出数据流动性的过程[12]。再次,“互联网+”之所以更能够颠覆传统行业,在于它以高端统摄低端,或者利用高效率来整合低效率,对传统产业核心要素进行再分配,它不仅是生产率的提高,也是生产关系的重构,并以此来提升整体系统的效率。互联网通过减少中间环节,减少所有渠道不必要的损耗,减少产品从生产到进入顾客手中所需要经历的环节来提高效率,降低成本。从最直观的广告产业领域看,2013年百度的广告收入首次超过中央电视台,中国最大的广告媒体不再是CCTV而是百度,一个成立15年的互联网公司一跃超过一家垄断性的国有传统媒体的广告收入。无独有偶,谷歌2013年全年的营业收入超过了600亿美元,已经超越所有的美国报纸或杂志的广告营收总和。广告产业领域仅是“互联网+”对传统产业进行效率整合的一个缩影而已。
因此可以说,“互联网+”与“+互联网”的根本区别在于,“互联网+”是以互联网为核心理念、基础设施和运作平台,而“+互联网”则主要是以互联网为手段或工具。进一步说,“互联网+”之所以具有高效率和全面的变革意义,是因为其本质在于它是以大数据为基本支撑和依托的,“互联网+”的核心或本质就是基于数据的整合和融合,即大数据化。由于数据本身具有天然的共享性和边际效率递增的特性,数据要素的投入和信息技术的应用,使得物质要素不断被节约,从而大幅度提高生产效率。只要人的日常生活以及社交活动迁移到互联网上,就会形成大量活跃的数据,就会随时被应用和挖掘。以电子商务领域为例,电子商务与实体商务最本质的区别是在电子商务平台上每卖出一个商品,都会留存下一串详尽的网络痕迹,这些痕迹就是数据。就此而言,一家电子商务企业和一家实体商店最大的区别就在于是否拥有大量准确的数据记录。一般而言,电子商务在发展的初级阶段,大都强调销量、强调人气、强调商气,并借此想方设法实现销量的增长,以销量的规模或市场地位换取市场话语权和主导权。而到了高级阶段,聚集庞大的数据就成为主要方面,数据成为企业的核心资产和核心竞争力。企业通过多年对各种各样数据的积累和对顾客消费行为的分析,可以成为消费者、销售者和生产者的引领者,从而企业本身也成为业界的领头羊。例如,亚马逊之所以在强手如林的竞争对手(如沃尔玛、苹果、IBM等超级公司)中能够在电子商务及云计算领域独占鳌头,且营业收入持续攀升、市值一度超过2000亿美元(2015年6月26日),其根本原因在于亚马逊通过丰富的体验性产品开发积累了比其竞争对手更庞大的数据资源。
当然,无论是电子商务、互联网金融、在线教育、智慧城市,还是互联网文化产业,都是建立在以大数据为基本支撑和依托的具体表现形式。以前,数据作为一种无形的、依附于其他要素的非独立要素,通过优化劳动力、资本技术等要素的结构和配置来间接施加对生产力的影响。而今,数据成为独立的生产要素,促成了数据量和处理能力的爆炸式增长,海量数据的积累与交换、分析与运用,产生了前所未有的洞见与知识,极大地促进了生产效率的提高。
在互联网特别是移动互联网时代,数据是无处不在、无时不在的,它无须刻意搜集和提炼,而是自动留存于人们的日常交往行为或交易活动之中。比如顾客在使用QQ和微信聊天的过程中,实际上是把最为私隐的数据信息交给了腾讯;在畅享网络购物便利的时候,就将账号、地址和电话数据交给了亚马逊或者天猫;在不断刷微博获取信息或娱乐时,就将兴趣、爱好和私信交给了新浪;在使用搜索服务时,就将自己的网络行为轨迹交给了百度或谷歌。前面网上曾流传着一个关于大数据在人们日常生活中具体表现的段子,让我们开始思考从未留意过却开始每时每刻无不影响我们的生活方式或生活习惯的新问题。这个段子如下[13]:
通过这个小段子,我们可以非常具体地认知到大数据时代人们既兴奋又无奈的基本生活图景。各种数据的广泛应用,一方面给人们带来了诸多快捷、便利和丰富的人性化服务,另一方面也面临着个人信息的极度曝光,让人没有了隐私、没有基本的安全感,需要设立一个新的个人信息保护模式,这个模式应着重于数据使用者为其行为承担相应的责任。这当然超出了本书所讨论的范围,我们暂且搁置不论。
无论如何,大数据在社会各领域快速渗透、开疆辟土甚至无孔不入,已经成为一个不争的事实。特别是自移动互联网主导以来,数据量更呈几何倍数激增。人们产生数据的方式由原来单一的模拟数据(书本和报纸等产生的数据)延伸到了各种各样的数字数据,从前的小数据快速进化成为大数据。根据赛门铁克公司的调研报告,2013年全球企业的信息存储总量已达2.2ZB,年增67%。我国最大的网购平台淘宝每天有超过数千万笔交易,单日数据产生量超过50TB,存储量40PB;百度公司数据总量接近1200PB,存储网页数量接近1万亿页,每天大约要处理60亿次搜索请求[14]。海量数据的迅速膨胀催生了大数据产业。国际数据公司发布的《中国大数据技术与服务市场2012—2016年预测与分析》报告表明,该市场规模将会从2011年的7760万美元增长到2016年的6.17亿美元,未来大数据市场将以每年40%的速度增长[15]。2016年5月底,腾讯整个数据存储中心存储总量已超过1000个PB,超过15000个全世界最大图书馆(美国国会图书馆)的藏书量,而且每天以500TB的数据上升。此外,腾讯的文本、图片、音频、视频以及移动支付等数据在国内都是排前两位的。每天在微信朋友圈、QQ空间里面上传大量的照片,数量非常惊人,在整个社交网络视频播放量和专业视频网站的播放量也正在高速增长。更令人印象深刻的是移动支付的发展,由于数据竞争非常激烈,为了争夺数据入口和支付平台各大公司展开红包大战,单在2017年除夕24小时内微信红包数量超过142亿笔,同比增长75.7%。
面对大数据的蜂拥而至,我们不禁要问,大数据究竟为何物?目前国内外对于大数据的定义并未形成高度共识,但基于大数据对人类的影响,研究者却从不同层面总结了大数据的基本含义。一般认为,大数据是指所涉及的数据量规模巨大,无法通过人工在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息[16]。舍恩伯格等则认为,大数据是以一种前所未有的方式,通过对海量数据进行分析,获得深刻的洞见以及具有巨大价值的产品和服务,大数据的核心是预测[17]。而在我看来,所谓大数据,一方面是由数量巨大、结构复杂、类型众多数据构成的数据集合,包含文本、视频、图片、位置信息、基因信息、浏览习惯、消费偏好等各种信息;另一方面,它又是一种在多样或大量数据中快速收集数据和分析应用数据的能力,其根本是为了洞悉顾客的需求变化。大数据与传统数据的主要不同之处就在于,它是基于云计算的数据处理与应用模式,通过数据的整合共享、交叉运用,所形成的新的智力资源和知识服务能力。
从数据的结构化程度的角度看,大数据可以分为结构化数据、半结构化数据和非结构化数据。结构化数据主要是指直接可以用计算机二进位来表达的数据,而类型繁多、规模庞大的半结构化数据和非结构化数据,则主要是视频、文档、网页、声音、图片、地理位置信息、基因信息等。从纵向动态利用开发的层次来看,数据(Data)是相对原始和零散的,当其经过过滤和有效组织之后成为信息(Information),将相关联的信息整合和有效地呈现则成为知识(Knowledge),对知识的深层领悟而升华到理解事物的本质并达到举一反三、触类旁通则成为智慧(Wisdom)。因此,数据逐步成为信息、知识以及智慧的源头,是进行决策和价值创造的基石[18]。大数据时代亦是人工智能、机器学习和数据挖掘等技术迅速发展所驱动的一个历史进程,这个进程要求我们善于利用各种各样的数据,并将数据分析为信息,将信息提炼为知识,以知识促成智慧决策或行动。
关于大数据的特征,结合国际数据公司的研究报告《从混沌中提取价值》[19]对大数据“4V”识别的分析,我们从动态发展和实际运营的角度来考察,认为大数据区别于传统数据的特征主要体现在如下三个方面:
第一,规模上“超海量”。既包括类型多样,如结构化数据、半结构化数据和非结构化数据,也包括体量巨大,从TB级别跃升到PB级别,不是以我们所熟知的多少G和多少T为单位来衡量,而是以P(1000个T)、E(一百万个T)或Z(10亿个T)为计量单位。之所以产生如此规模巨大的数据量,一是由于各种网络设备的使用,使我们能够感知到更多的事物,这些事物的部分甚至全部数据就可以被存储;二是由于社交工具的使用,使人们能够全时段的联系,使得交流的数据量成倍增长;三是随着传感器种类的增多以及智能设备等的流行,数据类型也变得更加复杂。
第二,性质上“活态”。现在处理的数据之所以由PB级代替了TB级,主要是因为数据是快速动态流动变化的。大数据的生命在于其流动进行的活跃状态,即网络化、在线、即时、互动、变化等,更快地满足实时性需求。大数据往往都以数据流的形式动态、快速地产生,具有很强的时效性,只有把握好对数据流的掌控才能有效利用这些数据,充分挖掘其中的价值。
第三,形态上“数字化”。“数字化”是大数据的技术支持,现在所有数据中约3%储存在报纸、书籍、图片等媒介上,其余97%全是数字数据。[20]大数据有两个重要来源,一是从实体到数字世界的静态迁移,二是在数字社会里各种文化活动或者其他的社交活动的交互。由此,数字化空间和数字化生存在很大程度上构成了现代人的基本生活方式和娱乐方式。
大数据不仅在于“庞大”,而且更在于“有用”,即是说,对于数据的分析、挖掘、应用,远比数据之数量本身更为重要。从大量数据中快速获取有用信息的能力,以及从大数据资产中快速变现的能力显得更为重要。比如,阿里巴巴近几年进行的大数据大布局,通过淘宝、天猫、阿里云、支付宝、蚂蚁金服、万网以及其他的一些网站,形成了强大的电子商务顾客群及数据管理系统。通过包括顾客销售端、资金使用、服务器管理、应用程序管理等,全面地对每一个消费者的行为数据都进行全系列的追踪收集,拥有容易变现的交易数据和信用数据,也形成了独一无二的数据处理能力。除此之外,还通过投资等方式掌握了丰富的社交数据、移动数据,如陌陌、UC、新浪微博和高德地图等。而百度主要拥有两种类型的大数据,即顾客搜索表征的需求数据以及爬虫和阿拉丁获取的公共Web数据,腾讯则拥有顾客关系数据和基于此产生的社交数据。这些数据可以分析人们的生活和行为,从里面挖掘出政治、社会、文化、商业、健康等领域的信息,可以预测未来走势和变化。
从现实发展来看,“我们正在从以控制为出发点的IT时代,走向以激活生产力为目的的DT时代”[21]。的确,DT(信息技术)时代与IT(数据技术)时代的显著差异集中体现在对生产力的深层影响上。单以阿里DT系列运营来看,阿里巴巴建设和推广的阿里云,让数据变成工程,围绕数据提供一整套的精细化服务。当前,阿里巴巴已在整个数据应用上确定了从IT到DT的两个重心:其一,从管理、控制到“点燃”和激发,DT就是“点燃”整个数据和激发整个数据的力量,被销售所用,为制造业所用,为消费者信用所用,被社会所用。其二,让阿里巴巴的数据逐渐成为国内商业的基础设施。淘宝和天猫每天会产生丰富多样的数据,阿里巴巴已经沉淀了包括交易、金融、SNS、地图、生活服务等多种类型的数据。这些数据相互关联或产生巨大的能量。当阿里的大数据开放之后,线上线下的数据能够串联起来,所有人都是数据提供方,也是数据的使用者。更重要的是,文化娱乐生态将与电商生态、金融生态、物流生态、云生态相互交融,让整个阿里生态体系更加丰满,为消费者和客户提供更加丰富的体验和更加多样的数据服务。作为一个新的重要业务板块,阿里巴巴文化娱乐集团不仅承载了阿里巴巴自身转型发展的使命,也担当了推动整个社会的电影、视频、文学、音乐、体育等相关文化娱乐产业与大数据融合的先锋。
总体而言,IT时代的工具集中体现为“硬件+软件”,而DT时代的工具突出表现为“云计算+大数据”[22]。IT时代是信息经济发展的初期阶段,DT时代是信息经济发展的升级阶段,引入生产过程的劳动对象集中于数据本身,开放流动、结构多样、海量数据是应用焦点,从数据驱动交易向数据产品开发演化。在生产要素层面,数据投入大量地替代着物质投入,数据技术与能源技术、机械技术一起推动着经济的强劲增长。
大数据的快速开发和广泛应用,正是DT时代变迁的决定性力量。数据技术的突破,体现在对原有难点的突破、应用层次的深化以及增长速度的提升等方面[23]。首先是原有难点的突破。高难度模式识别等领域一直被认为是信息技术难以逾越的高峰,而事实证明人类通过大数据可以有机会扫除征途上的障碍。比如,无人驾驶汽车就是典型的大数据产业,它集成了雷达和摄像头等传感数据,才使得它具备了在无人操控状态下自动驾驶的能力,而这种数据集成创新,现在以非常快的速度在迭代过程中。迄今为止,谷歌改装后的丰田普锐斯汽车已实现了无人自动化行驶里程达20万公里,仅有的一次事故还是被司机驾驶的汽车追尾;依靠谷歌地图和街景服务的庞大数据,摄像、雷达和光达先进设备,先进的模式识别软件,谷歌汽车实现了无人工干预的自动化控制,甚至比有人驾驶反应速度更胜一筹。其次是应用层次的深化。数据应用的层次也在不断深化,工业互联网是最具代表性的例证。美国通用电器公司率先提出了工业互联网概念,它力图将复杂的机器同联网传感器、软件系统等紧密结合,综合利用云计算、物联网等技术获取机器产生的大数据,通过分析有针对性地对机器运转进行相应调整,包括制造业在内的各行业推出产品或服务的速度将显著加快,生产效率将在系统层面得到优化。再次是增长速度的提升。工业互联网实践标志着互联网技术从消费领域向生产领域的全面进军。一方面技术能力提升很快,十八个月左右计算性能提高一倍、存储价格下降一半、带宽价格下降一半等持续印证着摩尔定律的效果;另一方面,随着联网顾客和设备数量的急速攀升,对各方来讲联入网络的价值显著增加,这进一步推动了信息技术的快速成长。信息技术指数级爆发成长,改变了人们对信息经济的预期。
在DT时代,必须从独立生产要素的角度去重新审视数据的作用。因此,大数据潜力的释放,实际上是反映了生产要素的一种升级,也就是所谓从信息技术到数据技术的升级。信息技术的不断突破,本质上都是在突破数据的依附,最大程度加速数据的流动和使用,由此数据逐渐成为独立的生产要素。从技术演进层面来看,核心技术经过了电子技术、计算机技术、电子通信技术和大数据技术四个阶段,无一例外均以超常规速度发展,加速实现着数据量和处理能力的快速增长。
DT时代也让我们不得不重新考量信息的含义,信息的价值已经不再是对于消息的垄断,而是各种各样的海量数据的共创共享。正如马云所言,IT时代是方便自己控制和管理,“信息”是一种权力。DT时代是利他、激活大众活力为主,DT是一个数据更充分流动的时代,会更加透明、利他,更注重责任和体验。在未来,产业发展主要由数据驱动。机器不仅会生产产品,还会说话、思考,还会自我完善;企业不再关注规模,不再关注标准化和权力,而会关注灵活性、敏捷性、个性化和用户友好;企业与企业、国家与国家之间不会那么注重对抗,而会在竞争的同时加强合作,并重视对整个社会的关怀和责任。[24]
IT和DT不仅是不同的技术,而且是不同的思维方式,即人们对待这个世界的方式以及生产传播信息的方式的不同。在这方面,自媒体就是一种表征。自媒体又称“公民媒体”,是指私人化、平民化、普泛化、自主化的传播者,通过互联网向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体。博客是自媒体的雏形,随着微博、微信、微视、微游戏等出现,自媒体开始快速成长发展。目前,我国拥有活跃用户的自媒体平台主要包括微博、微信、知乎、豆瓣、斗鱼、YY、映客、花椒、熊猫、秒拍、美拍、GIF快手、陌陌直播、蜻蜓、荔枝、喜马拉雅等。从自媒体与企业内在关联的角度看,自媒体按照发展程度不同可以分为两个层次:其一是企业的自媒体化,几乎所有企业都拥有自己的官网、微博、微信公众号等,以“自媒体”作为企业的营销手段。可以说,企业的自媒体化就是企业用企业官网、微博、APP、微信公众号等来发布或转发与自身相关的信息,加强企业与“粉丝”、用户之间的互动联系,以扩大品牌的影响力和营销购买力的自有传播载体。其二是企业以自媒体作为核心业务,即个人或者团体借助自媒体平台进行内容生产,经孵化后逐渐按照企业的运作模式进行经营,甚至从平台建设到内容生产以及运作与经营都由同一部分人群共同建设,这也是当今如雨后春笋一样的自媒体企业发展的基本历程。
随着各类自媒体的快速发展,人人皆媒体,人人都成为信息和内容的生产者和传播者,致使内容数据资源激增。自媒体主要表现为内容数据的自生产、自传播与自运营。从现阶段的自媒体企业来看,不管是“罗辑思维”还是“二更食堂”,绝大多数都是个人或团体依托自媒体生产出优质的内容,逐渐形成自己独立的IP。其实,与其他文化企业一样,自媒体企业的核心也是创造出品质优越、吸引用户的内容。不同的是,普通文化企业更多的是依靠专业人士生产内容,借助媒体平台进行内容营销,而自媒体企业拥有自身媒介优势,能够吸引更多的用户主动参与到产品生产与营销的过程中来,在内容与渠道上打通了企业与用户的关系。自媒体企业利用自媒体的传播优势,将自生产者“节点化”,即企业与用户、用户与用户、用户与信息交叉互动,使生产者的内容具有“话题核心圈子”的聚合性,最终形成一个大圈子并连成一个大网络,扩大内容的传播范围,增强信息的影响力度。