更新时间:2020-06-29 14:24:25
封面
版权信息
内容简介
前言
第1章 概论
1.1 什么是大数据
1.1.1 大数据产生的背景
1.1.2 大数据的概念及特征
1.2 大数据带来的变革
1.3 大数据的价值与挑战
1.3.1 大数据的价值
1.3.2 大数据时代面临的新挑战
1.4 大数据的相关技术
1.4.1 大数据存储和管理技术
1.4.2 大数据分析技术
1.4.3 大数据处理工具与平台
1.5 大数据的处理流程
1.5.1 数据抽取与集成
1.5.2 数据分析
1.5.3 数据解释
1.5.4 大数据处理模型
1.6 大数据的发展机遇
习题
第2章 大数据存储
2.1 大数据存储概述
2.2 传统的大数据存储系统
2.3 分布式文件系统
2.3.1 HDFS相关概念
2.3.2 HDFS分布式文件系统的结构
2.3.3 HDFS存储原理
2.3.4 HDFS数据读/写
2.4 NoSQL数据库
2.4.1 NoSQL的产生
2.4.2 NoSQL与RDBMS
2.4.3 NoSQL的分类
2.4.4 HBase数据库
2.4.5 NoSQL与NewSQL
第3章 大数据处理
3.1 多处理器技术
3.2 并行计算
3.3 MapReduce并行计算技术
3.3.1 MapReduce简介
3.3.2 MapReduce编程模型
3.3.3 Hadoop MapReduce 1
3.3.4 Yarn/MapReduce2
3.3.5 MapReduce性能调优
第4章 大数据分析
4.1 大数据分析概述
4.1.1 数据分析的原则
4.1.2 大数据分析的特点
4.1.3 大数据分析路线及流程
4.1.4 大数据分析技术
4.1.5 大数据分析的难点
4.2 大数据分析模型
4.2.1 大数据分析模型建立方法
4.2.2 分类分析模型
4.2.3 关联分析模型
4.2.4 聚类分析模型
4.3 大数据分析算法
4.3.1 大数据算法概述
4.3.2 决策树算法简介
4.3.3 Apriori算法简介
4.3.4 K-Means算法简介
4.4 大数据分析应用
4.4.1 文本分析
4.4.2 情感分析
4.4.3 推荐系统
4.5 大数据分析常用工具
第5章 大数据可视化
5.1 大数据可视化技术概述
5.1.1 数据可视化简史
5.1.2 数据可视化的功能
5.1.3 大数据可视化简介
5.2 大数据可视化技术基础
5.2.1 数据可视化流程
5.2.2 数据可视化编码
5.2.3 数据可视化设计
5.3 大数据可视化应用
5.3.1 文本可视化
5.3.2 社交网络可视化
5.3.3 日志数据可视化
5.3.4 地理信息可视化
5.3.5 数据可视化交互
5.4 大数据可视化软件和工具
5.4.1 大数据可视化软件分类
5.4.2 科学可视化软件和工具
5.4.3 可视化分析软件和工具
5.4.4 信息可视化软件和工具
第6章 大数据应用
6.1 互联网行业大数据
6.2 交通大数据
6.3 医疗大数据
6.4 问答系统
第7章 大数据发展趋势与展望
7.1 大数据安全与隐私保护