大数据云图:如何在大数据时代寻找下一个大机遇
上QQ阅读APP看书,第一时间看更新

数据、算法和速度,更加智能的计算机

作为人类,我们依然在作出不好的决策,例如闯红灯、拐错弯,或者得出错误的结论。但是就如我们本章所说,通过改变我们的行为,我们可以变得更聪明。我们也看到技术能帮助我们提升效率和减少错误。比方说,自动驾驶的汽车可以帮助我们避免闯红灯或者走错路。

揭秘大数据

为了使计算机变得更智能,也就是说让计算机能够作出更好的决策和预测,这里有三个发挥效用的主要因素:数据、算法和速度。

没有足够的数据,就很难识别出模式。当然,足够的数据并不是指所有数据。大数据意味着在足够的数据上进行分析的同时,创建能识别出模式的算法,也意味着它能够对我们的分析结果进行验证,以确定我们的结论是否正确。以某一天的数据作为样本可能没什么意义,但是以10年内的数据作为样本则有可能得出结论。

同时,如果我们无法快速地处理数据,就算是拥有世界上的所有数据也没用。如果你排队结账的时候,需要等上10分钟让欺诈检测算法来确定你是否能使用你的信用卡的话,估计这张信用卡你也不会再用了。同理,如果自驾车需要更多的时间来决定是往前开还是停下来,并以蜗牛爬行的速度行驶的话,没有人会使用自驾车的。因此速度也是至关重要的一个因素。

我们知道计算机在完成某些任务的时候非常高效,例如在试图辨别欺诈的时候快速分析海量的交易行为。但是与人类相比,它们在完成一些任务上仍然不尽如人意,比方说将口语转换成文本。而开启大数据时代最大的机遇之一,即被称为非结构化数据的领域,我们将在接下来的章节中探索分析。