更新时间:2019-01-04 23:44:52
封面
版权信息
前言
第一篇 基础篇
第1章 浅谈大数据
1.1 大数据概述
1.2 大数据平台
1.3 本章小结
第2章 大数据存储与运算利器——Hadoop
2.1 Hadoop概述
2.2 Hadoop配置及IDE配置
2.3 Hadoop集群命令
2.4 Hadoop编程开发
2.5 K-Means算法原理及Hadoop MapReduce实现
2.6 TF-IDF算法原理及Hadoop MapReduce实现
2.7 本章小结
第3章 大数据查询——Hive
3.1 Hive概述
3.2 HiveQL语句
3.3 动手实践:基于Hive的学生信息查询
3.4 基于Hive的航空公司客户价值数据预处理及分析
3.5 本章小结
第4章 大数据快速读写——HBase
4.1 HBase概述
4.2 配置HBase集群
4.3 HBase原理与架构组件
4.4 HBase Shell操作
4.5 Java API &MapReduce与HBase交互
4.6 基于HBase的冠字号查询系统
4.7 本章小结
第5章 大数据处理——Pig
5.1 Pig概述
5.2 配置运行Pig
5.3 常用Pig Latin操作
5.4 综合实践
5.5 本章小结
第6章 大数据快速运算与挖掘——Spark
6.1 Spark概述
6.2 Spark安装集群
6.3 Spark架构与核心原理
6.4 Spark编程技巧
6.5 如何学习Spark MLlib
6.6 动手实践:基于Spark ALS电影推荐系统
6.7 本章小结
第7章 大数据工作流——Oozie
7.1 Oozie简介
7.2 编译配置并运行Oozie
7.3 Oozie WorkFlow实践
7.4 Oozie Coordinator实践
7.5 本章小结
第二篇 挖掘实战篇
第8章 法律服务大数据智能推荐
8.1 背景
8.2 目标
8.3 系统架构及流程
8.4 分析过程及实现
8.5 构建法律服务大数据智能推荐系统
8.6 本章小结