更新时间:2024-11-22 16:07:57
封面
版权信息
内容简介
前言
第1章 实时数据仓库概论
1.1 什么是数据仓库
1.2 走进实时数据仓库
1.3 学前导读
1.4 本章总结
第2章 需求分析与架构设计
2.1 项目需求分析
2.2 项目架构概述
2.3 技术选型
2.4 本章总结
第3章 项目部署与框架搭建
3.1 集群规划与服务器配置
3.2 JDK与Hadoop安装
3.3 ZooKeeper与Kafka安装
3.4 Flink的安装与部署
3.5 本章总结
第4章 数据仓库建模理论
4.1 数据仓库理论准备
4.2 数据仓库建模实践
4.3 本章总结
第5章 构建ODS层之用户行为数据采集
5.1 日志生成
5.2 采集日志的Flume
5.3 本章总结
第6章 构建ODS层之业务数据采集
6.1 电商业务概述
6.2 数据同步概述
6.3 业务数据模拟
6.4 Maxwell数据采集
6.5 本章总结
第7章 构建DIM层
7.1 开发环境准备
7.2 关键技术解读
7.3 DIM层代码编写
7.4 本章总结
第8章 构建DWD层
8.1 概述
8.2 流量域五大事务事实表
8.3 交易域加购事务事实表
8.4 交易域下单事务事实表
8.5 交易域取消订单事务事实表
8.6 交易域支付成功事务事实表
8.7 交易域退单事务事实表
8.8 交易域退款成功事务事实表
8.9 事实表动态分流
8.10 本章总结
第9章 构建DWS层
9.1 概述
9.2 环境准备
9.3 流量域关键词粒度页面浏览各窗口汇总表
9.4 流量域版本—渠道—地区—访客类别粒度页面浏览各窗口汇总表
9.5 流量域页面浏览各窗口汇总表
9.6 用户域用户登录各窗口汇总表
9.7 用户域用户注册各窗口汇总表
9.8 交易域加购各窗口汇总表
9.9 交易域支付各窗口汇总表
9.10 交易域下单各窗口汇总表
9.11 交易域SKU粒度下单各窗口汇总表
9.12 交易域省份粒度下单各窗口汇总表
9.13 交易域品牌—分类—用户粒度退单各窗口汇总表
9.14 本章总结
第10章 数据可视化大屏
10.1 需求分析
10.2 Sugar BI介绍
10.3 本章总结
第11章 性能调优理论与实践
11.1 项目环境概述
11.2 YARN调优策略
11.3 Flink内存模型
11.4 并行度与slot
11.5 状态调优
11.6 反压
11.7 数据倾斜
11.8 Job优化
11.9 Flink SQL优化
11.10 Flink对接Kafka优化
11.11 DIM层调优实操
11.12 DWD层调优实操
11.13 本章总结
封底