守望与思索:人文清华讲坛实录IV
上QQ阅读APP看书,第一时间看更新

大数据的问题特征

那么,什么样的问题才是大数据问题?这要看它的问题特征(7)

第一个特征,是粒度缩放。粒度缩放是指我们碰到的这个问题的要素一定是数据化的,即这个要素不管是宏观的还是微观的,一定要可以通过数据表示。同时,可以像地图一样,可以在特别大的范围和特别细的范围之间缩放,能够在宏观、微观之间进行映射。

第二个特征,是大数据外部性导致的特征,称之为跨界关联。考虑问题的时候要看视角,问题边界在哪儿,如果考虑问题的时候这个边界到了传统边界之外,就是跨界了,而且你把这个外部要素和内部要素联系起来了,所以你在关联。比如管理学中,传统企业管理最常见的就是怎么把业务流程做好,优化流程,提高质量,同时改进人力资源环节、财务环节,制定企业战略,基本是站在企业内部看不同的部门,站在里面稍微往左看一看是供应商,稍微往右看一看是客户。企业花了很多努力,突然有一天一个人在网上拍了一板砖,说这个企业产品有问题、服务不好,还没有容得辩解,成百上千万跟帖,瞬间就把企业的产品、形象、品牌定格成了某一个形象、某一个状态。然后企业可能还很委屈,因为觉得这些人既不是我的客户,也不是我的员工,他们好像就是原本跟企业没有联系的社会大众,但是他们的口碑却对产品、质量、品牌、形象产生影响。因此,当管理决策的视角不仅是考虑内部,而且要考虑外部和企业相关的因素时,这个问题就开始变成大数据问题了。你要跨界,跨出你的传统边界。

第三个特征,全局视图。大数据实际是希望了解全貌的,它最后是要看画像,因为前面我的每一个点、每一个环节的数据叫作粒度缩放,同时和我相关的要素我又关联了,但是我最后要干什么?要了解全貌,要有个人画像、企业画像、政府画像、社会画像等,所以这个画像本身又是全景式的,从范围来讲是全景式的,从内涵来讲,我们希望既关联又因果。

举两个简单的例子看一看大数据问题的一些特点。

一个例子是旅游。比如某个景点,经常在一些时间和假期人满为患,有时候服务跟不上,人太拥挤,因此可能出现游客不满意投诉的现象。如果作为景点管理方,我想改进它,我可以增加员工、提高运力,但是我增加了车、增加了人的时候,可能第二天或者另外一个季度的这个时间段没有那么多人来。所以如果我们仅从景点这个边界出发来提供优化的方案,解决这样的问题就很困难。实际上,如果要解决景点的问题,一定要走到景点之外,比如旁边的餐饮、酒店、交通、气象如何,以及附近有没有其他景点、其他活动,等等。当我们考虑了景点内外要素时,就有了跨界关联的属性,作为整个的旅游来看景点内外时,有这样一个全局的视图,面对的就是一个大数据问题了。

另外一个例子是共享单车。有的人会认为共享单车其实就是简单的代步工具,但是这是传统的概念。现在一般每辆共享单车都有自己的感应器和定位装置,也就是说感测的数据粒度到了车和部件。这时候就不单是一个单车了,可能我走到什么地方,共享单车的App就告诉我附近有什么商圈、酒店、餐馆,我在什么地方买东西可能还可以用移动支付。当视角从单车走到了其他行业、要素时,就开始跨界关联了。可能在这个地区人特别多,共享单车不够,可能在另外的地方单车冗余了,因此,共享单车的平台应该清楚什么地方需要车,什么地方不需要车,怎么样调动,这就是全局视图。当共享单车具备粒度缩放、跨界关联和全局视图时,共享单车的运营、优化,就是一个大数据问题。

这些年社会上比较流行一个论断,说“大数据只讲关联不讲因果”。这个论断虽然有一定道理,但是总体来讲是误导的。特别是在做重要决策的时候,如果涉及的后果可能会有严重的人财物的损失,然后我告诉你说“你就这么干吧,没有为什么”,谁敢做决策?所以在大数据环境下做管理决策,既要看关联也要看因果。另外,因果是认识论的基本诉求,我们要知道原因。