第1章 数据为王
大数据的特性
大数据的云计算平台
去中心化的区块链数据库
大数据工具
数据安全
机遇与挑战
20世纪80年代,著名未来学家阿尔文·托夫勒在《第三次浪潮》一书中首次提到大数据(Big data)[1]。随着互联网、物联网和云计算技术的迅猛发展,大数据在互联网信息技术行业逐渐流行起来。联合国“全球脉动”项目分析了各国特别是发展中国家在运用大数据促进社会发展方面所面临的历史机遇和挑战,并系统地介绍了运用大数据的策略建议,从而推动了数据收集和分析方式的发展;70多个国家和地区已将大数据应用上升为国家发展战略。例如,美国、英国、日本及澳大利亚等国政府先后发布了大数据研究和发展战略规划;中国发布了《促进大数据发展行动纲要》,致力于建设国家数据统一开放平台,为大数据应用、产业和技术的发展提供行动指南。
大数据是一类呈现数据容量大、数据种类多、更新频率快、准确性高、价值密度低等特征的数据集。它不仅包括互联网上发布的信息,也包括各种联网传感设备得到的数据,比如个人健身运动轨迹、环境温度、空气湿度及空气污染指数。美国互联网数据中心(IDC)指出,互联网上的数据每年将增长50%,每两年便翻一番。数据的数量以指数形式递增,而且数据的结构越来越趋于复杂化。
对大数据的处理不采用随机抽样调查的方法,而采用对所有数据进行分析处理的方法[2],因而可以发现更多的细节。同时,大数据分析人员通过适当地忽略微观层面的精确度,可以获得更好的洞察力和更大的商业利益。因此,大数据是能够对数量巨大、来源分散、格式多样的数据进行采集、存储和关联性分析的新一代信息技术。由于数据超出了正常的处理范围和大小,用户不能采用传统处理方法,需要探索新的数据交叉、方法交叉、知识交叉、领域交叉、学科交叉等的科学研究方法。比如,云计算技术可以中心化地、快速地处理海量数据,区块链技术允许进行非中心化数据账本管理,而数据安全技术可以保证大数据只被授权者使用。随着这些技术的工具化,数据价值可以被快速合法地挖掘出来。
因为大数据可以用来实时、精确地洞察未知逻辑领域的动态变化,并快速重塑业务流程,进行组织和行业的新兴数据管理,其在各行各业中正扮演越来越重要的角色,发展前景与价值创造潜力十分巨大,将给我们的社会与生活带来巨大的影响[2,3]。因此,大数据是一种新的思维方式,它能够帮助人们从信息社会的海量数据中发现新知识,创造新价值,提升新能力,形成新业态[4]。