更新时间:2019-09-12 15:01:24
封面
版权信息
内容提要
编委会
丛书序一
丛书序二
前言
第1章 大数据概述
1.1 大数据的相关概念
1.2 大数据处理的基础技术
1.3 流行的大数据技术
1.4 大数据解决方案
1.5 大数据发展现状和趋势
1.6 教学建议及教辅资料
习题
第2章 大数据软件基础
2.1 Linux基础
2.2 Java基础
2.3 SQL语言基础
2.4 在VirtualBox上安装Linux集群
第3章 大数据存储技术
3.1 理解HDFS分布式文件系统
3.2 NoSQL数据库
3.3 Hadoop的安装与配置
3.4 HDFS文件管理
3.5 HBase的安装与配置
3.6 HBase的使用
第4章 MapReduce分布式编程
4.1 MapReduce编程概述
4.2 MapReduce编程示例
4.3 深入理解MapReduce程序的运行过程
4.4 MapReduce任务调度框架
4.5 MapReduce的数据类型与输入/输出格式
4.6 MapReduce编程实例
第5章 数据采集与预处理
5.1 流数据采集工具Flume
5.2 数据传输工具Sqoop
5.3 数据接入工具Kafka
第6章 数据仓库与联机分析处理
6.1 数据仓库
6.2 多维数据模型
6.3 Hive
6.4 Kylin
6.5 Superset
第7章 大数据分析与挖掘技术
7.1 概述
7.2 推荐
7.3 聚类
7.4 分类
第8章 Spark分布式内存计算框架
8.1 Spark简介
8.2 Spark的编程模型
8.3 Spark的调度机制
8.4 Spark应用案例
8.5 Spark生态圈其他技术
8.6 Zeppelin:交互式分析Spark数据
第9章 数据可视化技术
9.1 数据可视化概述
9.2 数据可视化工具
9.3 可视化组件与ECharts示例
9.4 与大数据平台集成
第10章 大数据安全
10.1 大数据安全的挑战与对策
10.2 基础设施安全
10.3 数据管理安全
10.4 安全分析
10.5 隐私保护
附录 《大数据技术基础》配套实验课程方案简介
参考文献