Greenplum:从大数据战略到实现
上QQ阅读APP看书,第一时间看更新

本书内容组织方式

Greenplum经过15年的精心打磨,成为出色的开源MPP数据库和数据处理基础平台,已应用于银行、保险、证券、电信、物流、安保、零售、能源和广告等行业。我们希望本书能给已经建立或者准备建立大数据平台的企业决策者、架构师、开发人员、数据工程师、数据科学家和数据库管理员带来帮助,也希望从事大数据科研工作的教育工作者和学生能从中受益。

本书分为四个部分。

● 第一部分介绍大数据战略。其中,第1章将分享作者对于ABC(人工智能、大数据和云计算)之间关系的理解以及对人和人工智能的思考。第2章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。

● 第二部分介绍大数据平台。其中,第3章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么Greenplum是理想的大数据平台。第4章为Greenplum数据库快速入门指南。第5章将介绍Greenplum架构的主要特点和核心引擎。第6章将介绍数据加载、数据联邦和数据虚拟化。第7章将介绍Greenplum的资源管理以及对混合负载的支持。

● 第三部分介绍机器学习与数据分析。其中,第8章介绍Greenplum的各种过程化编程语言(用户自定义函数),用户可以使用Python、R、Java等语言实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第9章将介绍Greenplum内建的机器学习库MADlib,数据科学家可以使用内建的50多种机器学习算法基于SQL对数据进行高级分析,并介绍如何扩展MADlib以实现新算法。第10章和第11章将分别介绍Greenplum如何对文本数据和时空数据(GIS)进行存储、计算和分析。

第12章将介绍Greenplum丰富的图计算能力。

● 第四部分介绍运维管理和数据迁移。其中,第13章将介绍各种监控和管理工具及相关企业级产品。第14章介绍数据库备份、恢复和迁移。第15章和第16章将分别介绍如何从Oracle和Teradata迁移到Greenplum。

限于作者学识,本书难免有疏漏之处,恳请同行和各位读者批判指正,我们将不胜感激。您可以通过数字化三部曲的官网(DigitX.cn)或Greenplum中文官方社区(greenplum.cn)给我们留言并了解Greenplum的技术信息、获得著作的相关学习资源。

冯雷

Pivotal中国常务董事兼研发中心总经理

姚延栋

Pivotal中国研发中心副总裁