大数据云图:如何在大数据时代寻找下一个大机遇
上QQ阅读APP看书,第一时间看更新

谷歌自驾车的美好未来

如果你使用网络,就多少会用到谷歌地图。谷歌的搜索引擎闻名于世,占据了市场主导地位,而谷歌地图也已累积了超过20PB的数据。换言之,这些数据需要超过82000个MacBook Pro硬盘(每个硬盘容量为256GB)才能存储下来。而所有的这些数据都已经被自驾车所运用了吗?答案是:的确如此。根据负责谷歌自驾车项目的斯坦福大学塞巴斯蒂安·特伦(Sebastian Thrun)教授所说,谷歌将一系列地图数据和实时激光检测系统、多个雷达、GPS以及其他设备检测到的信息相结合,使得系统能够“看到”交通流量、交通信号灯和路况。

自驾车不仅承诺会使道路更加安全,也会通过更好地利用行驶车辆间的空隙使道路更加畅通。据可靠消息,在美国每年约有43000人死于车祸,而每年全球死于车祸的人数为525万人。

谷歌自驾车虽然还不能自行思考,但是它们在模式匹配上能大有作为。通过结合地图上的现有数据和车辆传感器收集的实时数据,车辆可以制订驾驶决策。通过将不同的交通信号灯的样子与数据库进行比对,自驾车可以决定何时启动、何时停下。当然,如果没有以下三大要素,这一切不过是空中楼阁。而这三大要素是大数据的普遍主题:

●车上的计算机系统可以获取大量数据。

●车辆要充分使用传感器接收的有关其他车辆的位置、障碍物、交通信号灯还有地形等各类实时信息。虽然当下这些传感器的价格非常昂贵,一辆自驾车配备的所有设备的总价值在15万美元左右,但在未来它的价格有望迅速走低。

●自驾车要能够快速处理所有数据,并制订下一步的实时决策。这一切都是由后座上的少量计算机设备和大量软件实现。

想想60几年前,成功预测了艾森豪威尔总统选举结果UNIVAC计算机,可是有一个车库那么大呢。

计算机如何让欺诈无所遁形

以上的一切内容都显示出计算机非常擅长快速地进行模式匹配,这对于道路行驶或其他方面都非常有用。比如对于检测欺诈行为来说,快速地进行模式匹配就显得尤为重要。

我们中的很多人都可能接到过来自信用卡公司反欺诈部门令人毛骨悚然的电话。电话中,我们被告知自己的信用卡信息很可能已经被盗,而此时此刻正有骗子在某个社区五金店以你的名字刷卡消费。引起他们的怀疑的原因可能是,这个刚刚谈到的社区五金店,离你有8000公里远。

可以同时处理大量数据的计算机可以作出更好的决定,而这些决定会影响我们的日常生活。

试想一下你最近一次用信用卡在线支付的场景。当点下“提交”按钮时,付款页面的操作会引发一系列的事件:进行中的交易会被计算机用一套复杂的算法来确定是你本人在操作,还是他人在盗用你的信用卡。

问题是,要确定是他人在盗用信用卡还是本人在使用信用卡很不容易。数据泄露的情况这么严重,加之网络上能找到的你的个人信息如此之多,所以在很多时候,盗用者对你的了解可能和你对自己的了解差不多。

计算机系统通过一些基本的方式来识别你是不是本人:它会验证信息。当你把电话打进银行卡所在的银行时,银行会询问你的名字、居住地以及你母亲的娘家姓,然后将你所说的信息和在银行文件上记载的信息相比对。也许,银行还会查看你打进来的电话号码是否就是他记录的号码。如果这些信息都吻合的话,你很有可能就是本人。计算机系统也会评估你的一系列数据点,看这是否能成为证实你是本人的佐证,或者至少减少你是冒名顶替者的可能性。基于这些数据点,该系统至少能够生成一个置信度。

如果你住在洛杉矶,而你确实是从洛杉矶打进的电话,那你的置信度就会提高。然而,如果你住在洛杉矶却从多伦多打进电话,则有可能降低置信度。

更高级的评分机制(也称为算法)会把你的数据和盗用者的数据进行比对。如果打电话的人和盗用者的数据点有很多的相同点,这可能意味着打电话的人是盗用者。如果网站用户不是从过去的常用地登录(比方说俄罗斯,而他大部分时候都是从美国登录),而且他输错了几次密码,那他有可能是一个盗用者。计算机系统会将所有这些特征与你以及盗用者的普遍行为模式进行比对,以确定置信度应上升还是下降。

如果与你平常的行为有很大的出入,或者说与盗用者的行为模式有许多匹配之处,置信度会降低。而若是与你的平常行为有很多匹配之处,置信度则会上升。然而,对计算机来说,这样的分析存在两方面的问题:

●它需要非常多的数据,来识别你以及盗用者的普遍行为模式;

●在计算机已经识别了你们的行为模式之后,它需要在将你的行为与这些模式进行比对的同时,还能够处理上百万其他用户的指令。

因此提到数据分析应用,计算机能通过两种方式变得更加智能:

●提升用以检测正常行为和异常行为的算法准确度;

●加大可同时处理的数据量。

真正考验计算机和计程车司机的就是快速作出决策。伦敦的计程车司机和自驾车司机一样,需要了解向哪边拐弯,而且要根据交通和其他现实条件,一次次地作出判断。类似地,欺诈检测系统需要在几秒钟之内决定是否同意你的交易操作。正如科技公司Terracotta的首席执行官罗宾·吉尔斯洛普(Robin Gilthorpe)所说,“没有人想被‘拒绝’,特别是在电子商务领域。”如果被拒绝交易的是客户本人,这就不仅仅意味着丢了一笔生意,还意味着多了一个对你的服务不满意的客户。但是拒绝欺诈性交易又是确保非欺诈性交易的关键。

如早期的贝宝(PayPal)分析专家迈克·格林菲尔德(Mike Greenfield)所指出的一样,点对点支付公司贝宝率先发现,公司必须早早创建对抗欺诈的技术,没有这些技术,贝宝公司就没法生存下来,而人们也没法像现在这样简单、快捷地进行购买支付和相互转账。