前言用大数据解读商业与生活
如果现在是3月或12月,那你就得小心了——你很可能会面临分手。数据可视化专家大卫·麦克坎德莱斯(David McCandless)和李·拜伦(Lee Byron)分析了Facebook网站上的上万条状态更新并将其绘制成表,发现美国的春假和寒假前两周是分手高发期。
但如果现在是圣诞节,你的恋爱状态就会很不错。圣诞节是一年之中发生分手次数最少的时候。如果你认为大数据晦涩难懂,和你的日常生活没什么关系的话,那你就大错特错了。大数据带来的改变随处可见——交友网站利用大数据改变其用户资料的管理方式,营销人员利用大数据改变其营销方式,甚至我们在减肥时也会记录自己瘦身期间的各项数据并据此调整自己的减肥计划。
我是在法国进行铁人三项训练的时候迷上大数据的。我开始记录我爬过的每座山、跑过的每段路,以及在旧金山水上公园冰冷的水中游过的所有里程。然后,为了便于自己对这些数据进行回顾、可视化并进行分析,我将这些信息全部上传到了网络上。当时我并没有意识到,这将开启一段奇妙的探索之旅,而宝藏就是如今众所周知的大数据。
很多年前,人们就开始对数据进行利用。例如航空公司要利用数据弄清楚给机票定什么价位,银行要利用数据搞清楚该贷款给谁,信用卡公司则利用数据侦破信用卡诈骗。但是直到最近,数据,或者用现今的说法就是大数据,才真正成为我们日常生活的一部分。这是因为即使这些公司早在多年前就使用了大量的数据,但是这些数据或多或少都被我们忽视了。
之后,Facebook和谷歌出现了,至此大数据游戏被永远改变了。你和我,或者任何一个享受这些服务的用户都生成了一条数据足迹,它能够反映出我们的行为。每次我们进行搜索,例如查找某个人或者访问某个网站,都加深了这条足迹。当Facebook的用户尚少的时候,要存储所有用户的数据足迹并不是什么难事。但是很快地,Facebook用户数量激增,面对10000亿的网页搜索和超过10亿的好友,现有技术开始力不从心。
这些公司不得不创建新技术来存储、分析激增的数据——结果就迎来了被称为“大数据”的创新爆炸。其他公司看到谷歌和Facebook的所作所为,也意欲效仿,利用大数据找出客户所需的商品,以此提高其产品的销量。企业家想通过这些数据提供更便捷的医疗保健服务,市政府则想通过数据更好地理解当地居民,为他们提供所需的服务。
如今,大部分的公司拥有大量数据,但是公司的大部分员工并不是数据科学家。因此,现在存在的一个巨大的问题就是,对广大受众而言,围绕大数据的讨论依然过于技术化,显得遥不可及。
我有幸将这个高度技术化的课题——一个略显技术天赋的课题,呈献给大家,解释大数据对我们的日常生活造成的影响。这本书就是成果,它描述了大数据是如何改变我们的生活、恋爱和学习方式的。
在研究这一课题的过程中,我得到了很多人的帮助和支持,对此我深表感谢。我要感谢与我一同进行市场调研和咨询业务的公司,包括Aerospike, Cetas by VMWare, Cloudyn, Lattice, Lyris, New Relic, Newvem, Qliktech等。另外,我要特别感谢卡梅伦·梅尔沃德(Cameron Myhrvold)的指导和建议。