Greenplum构建实时数据仓库实践
上QQ阅读APP看书,第一时间看更新

第1章 数据仓库简介

对于每一种技术,都先要理解相关的概念和了解它之所以出现的原因,这对于我们继续深入学习其技术细节大有裨益。实时数据仓库首先是数据仓库,只是它优先考虑数据的时效性问题。因此,本章将介绍业界公认的数据仓库的定义,它和操作型数据库应用的区别,以及为什么我们需要数据仓库。

在对数据仓库的概念有了基本的认识后,有必要单独说明一下ETL(Extralt-Transformload,用来描述将数据从来源端经过抽取、转换、装载至目的端的过程)这个创建数据仓库过程中最重要的概念,然后向读者介绍四种常见的数据仓库架构。本章最后描述实时数据仓库的产生背景、特定需求和使用场景,并列举一些常见的实时数据仓库技术架构。