更新时间:2021-04-02 21:40:55
封面
版权信息
前言
第1章 大数据时代
1.1 什么是大数据
1.2 大数据的四大特征
1.3 大数据的商用化
1.4 大数据分析
1.5 大数据与云计算的关系
1.6 大数据的国家战略
1.7 企业如何迎接大数据
1.8 大数据产业链分析
1.9 大数据交易
1.10 大数据之我见
第2章 大数据软件框架
2.1 Hadoop框架
2.2 Spark(内存计算框架)
2.3 实时流处理框架
2.4 框架的选择
第3章 安装与配置大数据软件
3.1 Hadoop发行版
3.2 安装Hadoop前的准备工作
3.3 安装Ambari和HDP
3.4 初识Hadoop
3.5 Hadoop的特性
第4章 大数据存储:文件系统
4.1 HDFS shell命令
4.2 HDFS配置文件
4.3 HDFS API编程
4.4 HDFS API总结
4.5 HDFS文件格式
第5章 大数据存储:数据库
5.1 NoSQL
5.2 HBase管理
5.3 HBase编程
5.4 其他NoSQL数据库
第6章 大数据访问:SQL引擎层
6.1 Phoenix
6.2 Hive
6.3 Pig
6.4 ElasticSearch(全文搜索引擎)
第7章 大数据采集和导入
7.1 Flume
7.2 Kafka
7.3 Sqoop
7.4 Storm
7.5 Splunk
第8章 大数据管理平台
8.1 大数据建设总体架构
8.2 大数据管理平台的必要性
8.3 大数据管理平台的功能
8.4 数据管理平台(DMP)
8.5 EasyDoop案例分析
第9章 Spark技术
9.1 Spark框架
9.2 Spark Shell
9.3 Spark编程
9.4 RDD
9.5 Spark SQL
9.6 Spark Streaming
9.7 GraphX图计算框架
第10章 大数据分析
10.1 数据科学
10.2 预测分析
10.3 机器学习
10.4 Spark MLib
10.5 深入了解算法
10.6 Mahout简介
第11章 案例分析:环保大数据
11.1 环保大数据管理平台
11.2 环保大数据应用平台
11.3 环保大数据分析系统
第12章 案例分析:公安大数据
12.1 总体架构设计
12.2 建设内容
12.3 建设步骤
附录1 数据量的单位级别
附录2 Linux Shell常见命令
附录3 Ganglia(分布式监控系统)
附录4 auth-ssh脚本
附录5 作者简介