上QQ阅读APP看书,第一时间看更新
第一章 绪论
“大数据”,一个看似通俗直白、简单朴实的名词,却在全球引领了新一轮数据技术革新的浪潮。人类的数字世界可以包括数字电影、ATM中的银行数据、机场和重要活动(比如奥林匹克运动会)的安全录像、欧洲原子能研究机构中大型强子对撞机的亚原子碰撞记录、高速公路收费记录、通过数字电话线路传输的语音通话、用于日常沟通使用的文本等。
根据IDC(International Data Corporation,国际数据公司)“数字世界”研究项目的统计,2010年全球数字世界的规模为1.227ZB,首次达到了ZB(1ZB=1万亿GB)级别;而2005年只有130 EB,5年增长约9倍。这种爆炸式的增长意味着,到2020年我们的数字世界规模将达到40ZB,即15年增长约30倍。如果单就数量而言,40ZB相当于地球上所有海滩上的沙粒数量的57倍。如果用蓝光光盘保存所有这些40ZB数据,这些光盘(不包括任何光盘套和光盘盒)的重量将相当于424艘尼米兹级航空母舰(满载排水量约10万吨)的重量,或者相当于世界上每个人拥有5247GB的数据。无疑,我们已经进入了大数据时代。