更新时间:2023-08-28 20:29:18
封面
版权信息
作者简介
前言
第1篇 核心原理篇
第1章 HDFS历史延展
1.1 分布式与文件系统
1.2 HDFS设计及实现思想
1.3 小结
第2章 元数据架构
2.1 内存Tree设计
2.2 FsImage和Edit Log
2.3 meta更新
2.4 小结
第3章 数据管理
3.1 Namespace
3.2 Slave节点
3.3 Topology(Rack)Awareness
3.4 小结
第4章 Block与副本
4.1 理解Block
4.2 Block状态管理
4.3 副本状态管理
4.4 Block管理
4.5 副本策略
4.6 小结
第5章 通信与访问
5.1 HDFS RPC
5.2 文件写入
5.3 数据访问
5.4 小结
第6章 HA和QJM
6.1 HA发展路径
6.2 Quorum Journal Manager
6.3 HA原理
6.4 小结
第7章 缓存
7.1 分布式系统缓存设计
7.2 集中式缓存管理
7.3 缓存实践场景及改进
7.4 小结
第2篇 拓展与实践篇
第8章 集群拓展
8.1 水平拓展
8.2 垂直伸缩
8.3 多Namespace业务规划
8.4 小结
第9章 数据分层
9.1 存储分层的意义
9.2 HDFS存储分层
9.3 纠删码(Erasure Coding)
9.4 数据迁移
9.5 小结
第10章 监控、多租户和数据湖
10.1 大数据监控
10.2 多租户与认证
10.3 HDFS与Data Lakes
10.4 小结
封底