大数据金融与征信
上QQ阅读APP看书,第一时间看更新

1.7 大数据应用案例

1.7.1 案例之一:滴滴出行

目前,滴滴已成为整个中国甚至全球发展最快的互联网公司。拥有3亿用户,在中国400多个城市开展服务,司机超过1400万人,1400万的司机是整个中国所有机动车总量的10%。每天服务的订单超过1300万个,这个订单量让滴滴成为仅次于淘宝的中国第二大互联网交易平台。目前,滴滴平台上每天产生超过50TB的数据(相当于5万部电影),超过90亿路径规划次数。截至2015年12月,滴滴出行占据我国网约车市场46.6%的市场份额,神州专车以39.9%的比例排名第二,Uber占7.2%,排名第三。滴滴、Uber合并之前,快车市场基本算是两家的二人转;合并之后,占据专车市场90%以上的份额,算是快车市场的唯一选择。2015年,滴滴出行平台完成14.3亿订单,这相当于在中国平均每个人都使用滴滴打过一次车;累计行驶里程达128亿公里,相当于环绕中国行驶29万圈,累计行驶时间达4.9亿小时,相当于昼夜不歇地行驶56000年。所以滴滴的“数据大脑”对弈的是现实出行的海量数据,通过对每天24小时不间断产生的新数据,以及检测这些数据本身产生的二度数据,包括ETA、路径规划、实际路线、匹配时间等,进行研究、学习,最终实现订单匹配效率的提升,使司机取得更多收入,乘客更加快捷出行。

在业界看来,这巨大订单量背后实则体现的是滴滴出行超强的大数据计算能力。比如,如何将信息推送给更适合区域内的司机、谁优先获得订单,如何给乘客和司机补贴等策略,都要依靠大数据的支持。滴滴根据成交率和应答率来进行智能激励,以此增加用户的叫车意愿,而通过大数据计算,则让订单匹配更加智能,实现了智能派单。例如,以前司机需要开3公里才能接到1个客人,但现在可能0.5公里就能接到客人,在节省时间的同时,每天的订单成交量也会增加。

1.滴滴大数据与平台运营管理

1)供需预测

大数据的神奇之处就在于可以通过搜集到的数据,进行处理分析后,得到规律,然后利用这个规律对未来进行预测。在交通方面,大数据预测的能力极为重要,可以预测什么时间什么地方会拥堵。

大数据预测的关键是有足够多的、高质量的数据。当前滴滴每日峰值订单超过2000万单、每日处理数据超过2000TB,覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度,它所掌握的真实数据除了可以帮助预测路况外,还能对供需进行预测,供需预测越准确,越能更好地解决供需不平衡问题。

滴滴目前对15分钟后供需预测的准确度已经达到85%,基于这样的准确率,平台可以调度司机满足未来的打车需求,有效降低未来该区域供需不平衡的概率。

2)路径规划

路径规划和ETA两项地图技术是实现智能派单的关键,也将直接影响到司乘双方的使用体验。通过海量历史数据,可以对未来路况做预测,实现A点到B点的路径规划,它是派单的核心,工程师围绕最低的价格、最高的司机效率和最佳交通系统运行效率来做算法。

ETA是指预估任意起终点所需的行驶时间,要求精准性。滴滴将机器学习应用到ETA,这是解决“订单高效匹配”和“司机运力调度”的关键技术。当前滴滴ETA可以预测每一单出行的时长以及预估在每一个路口前的等待时长,这项技术可以帮助滴滴在更合适的时间对运力进行更好的调度。ETA/路径规划及其学习系统如图1.13所示。

图1.13 ETA/路径规划及其学习系统

3)智能派单

滴滴叫车和搜索商品的逻辑不同。网上的商品、资讯等信息都是静态停留在那里,计算方式只是将这个商品、信息挖掘出来;而滴滴的计算则类似于动态打靶,车辆永远在运动当中,要在众多运动的车辆中,给乘客一个最优的选择,不光是距离,还有时间。滴滴研发的基本原则是想办法撮合乘客和司机,满足他们的需求,保证他们的体验。简单点说,就是将订单发送给合适的司机。以滴滴专车业务为例,目前还要用到人为制定的规则,例如如何将信息推送给最适合区域内的司机、谁优先获得订单等。在数据量较小的情况下,可以基于规则、人的经验来设定算法,但是在数据量更大更丰富的情况下,这样的做法可能和现实存在一定程度的脱节。

这是一个颇为繁杂的过程。除了推荐算法要准确、匹配效率要高、计算要快、推送要及时外,还要在推送订单到这位司机之前,通过对小费、长短途、时间、方向敏感等静态特征和司机与订单之间的位置关系、时间关系等动态特征进行综合分析来预测他对订单感兴趣的程度。智能派单对订单量和司机数进行预测,然后通过大规模分布式计算来实现上述的最优撮合。为了实现这一目的,供需预测、动态调价、路径规划以及服务分的算法技术要一起发挥作用,它们最终为实现最优派单而服务,它们的算法都将结合到智能派单系统中,帮助在动态环境中撮合乘客与司机的交易。

高峰期滴滴平台每分钟接收超过3万乘客需求,每2秒钟做一次订单匹配,每一次发单背后,滴滴大脑运算次数为百亿次级别。此外,滴滴还可使用大数据技术来预估每个司机的服务分值,包括乘客打分、乘客评价、取消率等因素,并利用算法模型来计算不同服务水平的司机对用户产生的长期影响。

4)九霄

九霄是滴滴大数据孵化的出行领域智能决策技术产品,能够把错综复杂的时间、空间、业务维度的N次元出行领域数据,转化成易于理解的二次元数据,搭建数据理解的桥梁,帮助运营、产品、BI、研发人员发现问题、分析问题、解决问题,产生切实的业务收益。

滴滴将出行领域的数据,进行整理、挖掘、智能聚合,在地图空间和时间轴上进行合理的呈现,使用户能够直观地感知在什么时间、什么地点、各个业务线的什么业务维度(乘客、订单、运力、体验等),发生了什么,方便深入追踪、探寻业务痛点和原因分析。

例如,通过九霄,对地图上任意区域的供需平衡状况、订单满足情况能够一目了然,并且结合九霄的精细化分析能力,能够细化到某个地理围栏的供需策略,进行围栏级别的运力调度策略配置;(在代驾场景上)基于机器学习进行供需预测,判断哪些区域存在运力缺口,自动化调度司机调节供需平衡。实际上,九霄是凭借科学可视化技术能力、算法能力和高性能架构能力,将数据变为知识,作为决策依据。

此外,给乘客什么样的补贴、给司机什么样的补贴、谁更敏感、多少金额影响更积极,这些策略的背后都是大数据在起作用。

2.滴滴大数据与城市智慧交通建设

1)城市道路优化

对大多数用户而言,网约车只是一个打车工具。实际上,网约车背后能做的远远不止这些。每一次的出行背后都是数据的调动和积累,都是对一座城市更为深入的了解。对一座城市而言,尤其是一线城市,网约车有着重大的存在意义。

其一,优化用户出行体验,为用户的出行需求插上互联网的翅膀。

其二,参与优化城市道路交通。习惯网约车后,越来越多的用户正在逐步减少开车次数,一定程度上缓解了道路交通压力和减少了汽车尾气排放。

其三,优化城市道路交通基础规划。

当用户打开滴滴出行APP叫车时,毫秒之间,滴滴大脑平均需要CPU运算576亿次,才能为用户匹配出最优的车辆。这个让人难以置信的数字,深刻反映出滴滴大脑惊人的大数据运算处理能力。推荐上车点“黑科技”上线后,截至2016年,滴滴平台上超过30%的司机和乘客,按照小绿点不需要通话就可以找到对方,司机的通话量平均下降10%,乘客等候时间平均减少1分钟。这些黑科技的背后,其实就是滴滴对一座城市的学习,并且是动态的学习。更好地了解学习城市动态,才能为用户提供更准确的出行服务体验。

2)滴滴交通云

以武汉为例,滴滴大数据显示,武汉有超过50%的乘客愿意与别人分享,选择拼车出行。2016年1—10月,武汉有超过2900万人次通过拼车和顺风车出行。据测算,一辆充分使用的分享汽车,如果每次行程能够载2~3组目的地相近的拼车乘客,每天可减少20~40辆私家车上路,因而会大大降低机动车空驶率和上路率。武汉市每天的快车拼车和顺风车出行达10.2万人次,如果按私家车平均每辆车每天出行2次,每次载客1.5人计算,这相当于武汉每天减少3.4万辆小汽车出行。

这些庞大的海量数据,都正实时上传到滴滴秘密打造的一朵云——滴滴交通云上。滴滴大脑在这朵云上,根据交通度量体系设定,分析海量数据,让分析结果为乘客、司机、交通主管部门等所有出行参与方都带来价值。滴滴出行正与武汉市交管局共同持续推进武汉“互联网+交通”建设,双方将在路况服务、智能交通云服务等方面进行深度合作。章文嵩介绍,被植入滴滴交通云的城市将发生至少三大变化。

第一,滴滴交通云可以利用智能调度优势帮助改善城市交通拥堵问题。比如,在空间维度,A到B点有很多乘客,滴滴交通云有可能规划不同的行驶道路,让每个路网的车流量均衡。而在时间维度,滴滴交通云可以尝试对早高峰出行的人做精准营销,比如9点出行的乘客,如果8点出行,补贴5元,从而在时间维度上,达到削峰填谷的作用。

第二,滴滴交通云未来还可协助设计智能交通管控方案,提高道路利用率。比如,滴滴交通云可以实现智能信号灯控制,通过数据模型算出整个区域的车流量情况,靠区域的红绿灯协调,让城市各条道路的通行效率更高、更流畅。

第三,滴滴交通云的价值还将体现在,为城市的路网优化提供决策依据。比如,4个车道,左转弯应该一个还是两个,滴滴交通云都可以给出精准建议。滴滴交通云也会对新建路网做规划建议,比如,应该在哪里建路,或者要不要建一座桥等。

对大众用户而言,很难通过打车去切身体会滴滴大数据的作用,但对于城市交通规划部门而言,交通大数据的采集或许能够针对性解决一些实质问题,尤其是对一些缺乏大型城市交通规划能力的城市而言。

案例小结:滴滴是一个移动互联网产品,依托移动支付,有几乎100%的支付接入率,滴滴的互联网金融想象空间很大。滴滴将出行连接结构化、数据化,意味着全程可追溯、可评价、可反馈,形成一个促进司机服务不断优化的正向循环生态。滴滴生态里有大量司机资源,滴滴企业平台也是互联网金融好场景,滴滴账户余额也可以变身滴滴版余额宝,只要有海量信任连接的用户,一切都是可以想象的。

1.7.2 案例之二:大数据与美团外卖的精细化运营

美团最初是一个互联网公司,美团的团队之前做校内网(人人网的前身),后来做饭否网,再后来因为某些原因饭否网被关掉之后,开始转做美团网。2013年11月上线的美团外卖,在两年半的时间内成为中国最大的外卖平台,最近日订单已经突破400万份,这个数字放在所有电商交易平台里也能轻松排到前列。而这种高速发展的背后,与大数据技术的支撑和精细化运营是分不开的。美团外卖首先是一个线下商户与线下消费者的线上交易平台,对商户来说,一方面美团可以帮商户解决知名度的问题,可以通过这个平台触达更多的用户。另一方面,由于很多的消费不是发生在线下,商户不需要租用一个大面积、好地段的商铺,可以减少店铺的租金。对消费者来说,可以有更多的选择,并且对现在很多追求生活享受的“宅男”“宅女”或一些生活节奏较快的人也非常方便。

外卖O2O和传统的电商存在一些差异。可以简单总结为如下几点。

一是新事物,快速发展。这意味着很多用户对外卖的认知较少,对平台上的新品类缺乏了解,对自身的需求也没有充分意识。平台需要去发现用户的消费意愿,以便对用户的消费进行引导。

二是高频。外卖是个典型的高频O2O应用。一方面,消费频次高,用户生命周期相对好判定;另一方面,消费单价较低,用户决策时间短、随意性大。

三是场景驱动。场景是特定的时间、地点和人物的组合下的特定的消费意图。不同的时间、地点,不同类型的用户的消费意图会有差异。例如,白领在写字楼中午的订单一般是工作餐,通常在营养、品质上有一定的要求,且单价不能太高;而到了周末晚上的订单大多是夜宵,追求口味且价格弹性较大。场景辨识越细致,越能了解用户的消费意图,运营效果就越好。

四是用户消费的地理位置相对固定。结合地理位置判断用户的消费意图是外卖的一个特点。

1.大数据在美团外卖画像技术中的应用

美团外卖经过3年的飞速发展,品类已经从单一的外卖扩展到了美食、夜宵、鲜花、商超等多个品类。用户群体也从早期的以学生为主扩展到白领、社区以及商旅,甚至包括在KTV等娱乐场所消费的人群。随着供给和消费人群的多样化,如何在供给和用户之间做一个对接,就是用户画像的一个基础工作。所谓千人千面,画像需要刻画不同人群的消费习惯和消费偏好。

1)外卖产品运营对画像技术的要求

我们大致可以把一个产品的运营分为用户获取和用户拓展两个阶段。在用户获取阶段,用户因为自然原因或一些营销事件(如广告、社交媒体传播)产生对外卖的注意,进而产生了兴趣,并在合适的时机下完成首购,从而成为外卖新客。在这一阶段,运营的重点是提高效率,通过一些个性化的营销和广告手段,吸引到真正有潜在需求的用户,并刺激其转化。在用户完成转化后,接下来的运营重点是拓展用户价值。这里有两个问题。第一个问题是提升用户价值,具体而言就是提升用户的单均价和消费频次,从而提升用户的LTV(life-time value)。基本手段包括交叉销售(新品类的推荐)、向上销售(优质高价供给的推荐)以及重复购买(优惠、红包刺激重复下单以及优质供给的推荐带来下单频次的提升)。第二个问题是用户的留存,通过提升用户总体体验以及在用户有流失倾向时通过促销和优惠将用户留在外卖平台。所以用户所处的体验阶段不同,运营的侧重点也需要有所不同。而用户画像作为运营的支撑技术,需要提供相应的用户刻画以满足运营需求。如图1.14所示为美团用户体验过程。

图1.14 用户体验过程

2)外卖画像系统架构

画像服务的架构包括:数据源包括基础日志、商家数据和订单数据。数据完成处理后存放在一系列主题表中,再导入kv存储,给下游业务端提供在线服务。同时会对整个业务流程实施监控。主要分为两部分,第一部分是对数据处理流程的监控,利用内部自研的数据治理平台,监控每天各主题表产生的时间、数据量以及数据分布是否有异常。第二部分是对服务的监控。目前画像系统支持的下游服务包括广告、排序、运营等系统。如图1.15所示为美团画像系统架构。

图1.15 美团画像系统架构

2.大数据在美团外卖客户挖掘和预测中的应用

1)新客运营

新客运营主要需要回答下列3个问题。

(1)新客在哪里?

(2)新客的偏好如何?

(3)新客的消费力如何?

回答这3个问题是比较困难的,因为相对于老客而言,新客的行为记录非常少或者几乎没有。这就需要通过一些技术手段做出推断。例如,新客的潜在转化概率,受到新客的人口属性(职业、年龄等)、所处地域(需求的因素)、周围人群(同样反映需求)以及是否有充足供给等因素的影响;而对于新客的偏好和消费力,从新客在到店场景下的消费行为可以做出推测。另外用户的工作和居住地点也能反映他的消费能力。

对新客的预测大量依赖于他在到店场景下的行为,而用户的到店行为对于外卖是比较稀疏的,大多数用户是在少数几个类别上有过一些消费行为。这就意味着需要考虑选择什么样的统计量描述,如消费单价,总消费价格,消费品类,等等。然后通过大量的试验来验证特征的显著性。另外,由于数据比较稀疏,需要考虑合适的平滑处理。

美团在做高潜新客挖掘时,融入了多方特征,通过特征的组合最终做出一个效果比较好的预测模型。美团能够找到一些高转化率的用户,其转化率比普通用户高若干倍。通过对高潜用户有针对性的营销,可以极大提高营销效率。

2)流失预测

新客来了之后,接下来需要把他留在这个平台上,尽量延长生命周期。营销领域关于用户留存的两个基本观点是:获取一个新顾客的成本是维系现有顾客成本的5倍;如果将顾客流失率降低5%,公司利润将增加25%~85%。

用户流失的原因通常包括:竞争对手的吸引、体验问题和需求变化等。美团借助机器学习的方法,构建用户的描述特征,并借助这些特征来预测用户未来流失的概率。这里有两种做法:第一种是预测用户未来若干天是否会下单这一事件发生的概率。这是典型的概率回归问题,可以选择逻辑回归、决策树等算法拟合给定观测下事件发生的概率。第二种是借助于生存模型,例如COX-PH模型,做流失的风险预测。图1.16左边是概率回归的模型,用户未来T天内是否有下单作为类别标记y,然后估计在观察到特征X的情况下 y的后验概率P(y|X)。右边是用 COX模型的例子,我们会根据用户在未来T天是否下单给样本一个类别,即观测时长记为 T。假设用户的下单的距今时长 t<T,将t作为生存时长t';否则将生存时长t’记为T。这样一个样本由三部分构成:样本的类别(flag)、生存时长(t')以及特征列表。通过生存模型虽然无法显式得到Pt' | X)的概率,但其协变量部分实际反映了用户流失的风险大小。

图1.16 流失预测模型

生存模型(见图1.17)中,βT x反映了用户流失的风险,同时也和用户下次订单的时间间隔成正相关。在箱线图中,横轴为β Tx,纵轴为用户下单时间的间隔。

图1.17 生存模型

美团做了 COX模型和概率回归模型的对比。在预测用户××天内是否会下单上面,两者有相近的性能。美团外卖通过使用用户流失预警模型,显著降低了用户留存的运营成本。

3.大数据在美团外卖用户补贴中的应用

美团外卖吸引顾客的一个方式是用户补贴。用户补贴对于平台而言是一笔巨大的运营成本。但是在很多情况下,用户补贴是很有必要的。平台都希望吸引更多的新用户以及留住老客户,这是业务发展的重中之重。那么,怎样进行用户补贴才能有助于平台吸引客户,之后源源不断地在平台上消费,这就需要大数据分析作为支撑。

首先,以客户留存率和自动转化意愿将用户群体划分为四个象限(见图1.18)。第一个维度是客户留存率。在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用应用的被认作是留存客户;这部分用户占当时新增用户的比例即是客户留存率。需要关注的是,对于刚开始使用美团外卖的新用户,有多大可能性会一直留在平台,在平台不给补贴的情况下,还会不会继续留在平台。有的用户在只有给红包的情况下才会留下,这就是留存率低的情况。另一个维度是用户的自动转化意愿。平台上每天都会有很多新客户,有的新客户没使用红包就开始使用平台的服务,有的客户只有给他发红包才能完成转化,但是转化之后会成为平台的忠实客户,有的客户一旦没有红包就会自动流失。那么,对于自动转化意愿高的用户,不给红包也愿意使用,如果能识别出来这类客户,就可以不给补贴。还有一些只有收到红包才使用,之后又会流失,如图中第三象限,这部分用户最好不发补贴。平台需要识别给了红包就可以一直留在平台,即使以后没有红包也会一直保持消费忠诚的客户。要知道客户属于哪个象限的,就需要用大量数据做挖掘。

图1.18 用户群体划分

为了识别不同类型的用户,需要做用户画像(见图1.19),首先通过各种渠道了解用户的年龄、婚姻状况、收入水平、消费习惯、常住地等,了解这些信息后,需要做一次用户模型的训练,即把各种参数跟四个象限做一次训练,就知道给什么样的用户推红包。以下分析如何使用用户画像来寻找补贴对象。

图1.19 用户画像要素

图1.20是数据挖掘的流程示意图。美团外卖也是一个大数据公司,每天有大量用户浏览网页、大量用户在网站上购买、用户的位置属性和手机型号这些数据也都可以获得,另外还有用户自己填写的性别、年龄等,这些都可以用来做用户数据的挖掘。有了这些数据之后,通过数据挖掘的算法,对用户进行深入的挖掘之后,再去完善用户的各种画像,就可以得到一个模型。然后对于任何一个特定的用户,将其浏览购买历史的信息输入模型中,就可以知道这个用户很多具体的特征。例如,用户的年龄为25到30,可能是一个刚毕业没多久的白领。例如,用户是一个夜猫子,那么平台就在晚上向其推荐一些夜宵。再比如,单身理工男,他可能就不太喜欢甜食、水果。这就是平台通过大数据挖掘得到的很多用户画像的信息,之后将这些信息用于平台用户营销、用户补贴等方面,可以快速提高平台识别和分析用户的精准度。如果理想情况下,把原来随便撒红包的形式,限制在一个象限,平台资金的使用效率就会更高,这就是大数据在用户补贴方面的使用。

图1.20 用户画像流程

4.大数据在美团外卖供应链中的应用

“外卖 O2O”是一种特殊的O2O形态,多了一个配送和调度的部分。其他如信息发布、用户信息的搜索以及支付和以往都一样,只是履约部分由消费者到商家店里消费改成配送上门。配送团队首先报告给平台,每一个配送员的位置在什么地方,平台根据这个定位和订单的信息发起调度,告诉配送员去取哪个订单,然后这个配送员就可以去商户那边把订单取回来,送给消费者,这是外卖O2O的模式。

1)O2O闭环

外卖O2O模式的真正价值在于通过线上工具与云服务器、CRM、餐饮管理系统的信息化无缝闭合回路,依靠云计算功能处理、转化、应用大数据。所以,只有无缝整合线上线下资源,形成O2O闭环才是企业能否踏入大数据时代的关键。外卖O2O闭环的难点和痛点在于,如何收集线下消费者体验的反馈信息,并将线下用户引到线上交流,进行线上体验。有的商家以为自己促使消费者完成线上的支付就是O2O闭环,这是肤浅的想法。把消费者从线下送到线上,这个线上不仅仅是支付,而是要形成线上的消费者与消费者、消费者与商家之间的互动。

互动需要一个能够容纳消费者和商家的平台。现在看来,微信平台是一个不错的选择。可以在微信上建立一个公众平台,与消费者进行互动交流。互动的话题可以是让消费者自己来设计喜欢的菜单,让消费者自己来设计喜欢的菜品。一旦得到采纳,消费者可以获得奖品,或者是此菜品永远对该设计者免费。这样,除了在平台上完成订餐、点菜、支付等功能外,还能根据消费者的消费行为有针对性地进行推广和促销。更重要的是,能充分发挥粉丝经济的作用,让粉丝参与到服务改进、菜品改进中来,提高顾客的满意度并提升商家的销量和形象。

自此,把消费者从线下引到线上的途径就达成了,这样才是一个真正的O2O闭环(见图1.21)。从线上到线下,再从线下到线上,消费者在被引导,数据和信息才会流入商家的口袋中。

图1.21 大数据库O2O闭环

2)配送的智能调度系统

如图1.22所示为配送调度的示意图,黑色的袋鼠是配送员(骑手)。一般而言,平台没法预测用户下单的位置。每个用户下单的频率不一样,下单的餐馆也不一样。这些骑手站位要怎么站位,这么多订单要让哪个骑手取哪个订单,用什么顺序送这个订单,这些在极大程度上影响了骑手的能效。如图1.23所示为配送要考虑的因素。

图1.22 美团外卖配送调度图

图1.23 外卖配送问题

如果考虑一个数学模型(见图1.24),目标函数就会优化很多的变量,比如说每一单平均的行驶距离,因为平台根据这个给配送员付工资;配送时间,这个决定了用户的体验;运单的准时率;如果订单很多,骑手有限,实在送不过来,希望最坏的体验也不要太坏;还有骑手的满意度,在平台技术团队看来,骑手也是平台的客户,所以预期在分派订单的时候骑手也是满意的。

图1.24 配送调度问题的数学模型

如图1.25所示为美团外卖现在使用的一套系统。平台同样会用很多的特征数据来挖掘,包括给骑手画像,即骑手的骑程速度、送多少,他的箱子能送什么,骑什么车送外卖,等等。给商家画像,即这个商家一天最多出多少单,可以做多少盒外卖,商家从接到订单到准备好订单平均大约几分钟,等等。还有各种配送指标,包括统计指标、骑手上报的各种路径,然后都会放在其中进行挖掘。挖掘之后会结合所做的一个数学模型在一个仿真平台上运行,运行之后发现这个算法可以,就放到一个实时的海量计算平台上给实时的这些订单做实时调度。调度算法是基于一个多目标的运筹优化的数学模型。在做调度的过程中,会同时监控每一个订单,监控实际配送时间跟预期的配送时间是否相同,骑手实际走什么样的路径,跟系统预期的最佳路径是否相同,还包括一些骑手给平台反馈一些不好的调度方案等。平台把这些信息都收集回来,再输入到回放平台,找到那个时间点再回放一下,这样可以指导这个算法有什么地方可以优化,或者需要添加哪些新的数据参数。

图1.25 美团外卖配送的智能调度系统

这个系统数据量特别大,同时包括骑手的数据,十几万骑手,每十秒上报一个位置,所以有特别多的点。再加上给全国很多城市做配送,美团专门跟气象部门合作,购买了每个城市的实时气象数据,然后系统会根据气象数据知道城市的雨雪情况,根据这个天气情况做调度,在这里需要输入的数据特别多。基于这种情况,平台使用大数据技术对配送的调度方案进行不断的探索和优化。

5.大数据在扼制恶意刷单套现中的应用

有用户补贴往往会带来刷单作弊,一般有利益的地方就容易产生这种情况。刷单就是一种行业毒瘤,简单来说就是一些作弊的订单和作弊的交易。刷单者有很多不同的目的,比如说用大量虚假的订单套取补贴的利率、套现,以及制造一些虚假的订单量。例如,一个店铺入驻美团外卖之后,本来一个月卖三单五单,通过大量的虚假订单,一个月一下子能有1000单的销量。因为美团外卖网站按照销量对商家进行排名,通过刷单把月销量刷上去,店铺排名就在上面,就会带来更多的流量,这就是制造虚假订单。还有一部分是利用虚假订单写一些虚假的评论来误导用户。跟补贴相关的,主要是补贴套现。

与刷单行为做斗争对O2O行业的发展是非常重要的一件事情。美团最初的做法,是在网页上面放了一个链接,让大家举报刷单,运用群众的力量抑制刷单。然而这种方法没有什么用,因为真正刷单的人,如在家里用“猫池”刷单的人,别人是无法知道的。事实证明,通过这种方式接到的举报很少,而接到的举报经查,往往是商家的一些竞争对手为了打击对方的虚假举报。在这种情况下,只有靠大数据的技术手段才能抑制刷单,如图1.26所示。

图1.26 美团外卖防刷单模型

图1.26只是一个简单的示意图,美团外卖平台会收集大量的数据,包括每个月用户所有的下单历史、浏览历史,商家的销售历史,例如一个商家销售1000单,这1000单到底是卖给了一个用户还是卖给很多个用户,这里面可以找到很多规律。美团现在每个订单都是由配送员配送的,每个配送员的APP要每隔10秒汇报一次他的地理位置,所以平台有所有配送员的路径记录。同时有一支运营团队去人工分析,哪些订单是刷单的,有哪些特征。利用这些人工的样本作为种子,加上上面的一些数据,同样的把它们输入到整个系统的大数据库里面。最后有一个防刷单模型,基于这个刷单模型就可以判断某个用户刷单的可能性和商家刷单的可能性。对可能性比较高的,平台运营人员会介入并分析,如果是真的就予以比较严厉的惩罚,情节较轻就追回刷单的赃款,对于情节较重的行为将以欺诈的罪名,上报相关法律机构。

案例小结:互联网企业具有高速的发展潜力,互联网企业的竞争正在从资本驱动,慢慢走向技术驱动、数据驱动。对这些企业而言,整体上由原来的补贴导向的竞争,慢慢变成靠公司整体的运营治理、技术和数据导向的竞争。