Spark大数据编程实用教程
上QQ阅读APP看书,第一时间看更新

第1章 Spark与大数据

本章介绍大数据和Spark开发相关的概念和技术,目的有两个:第一个是让读者能够对大数据及相关技术有一个总览,进而对Spark在整个大数据开发中的地位和重要性加深理解;第二个是帮助读者对Spark技术栈中所涉及的技术、知识点有一个全面、细致的认识,结合Spark快速学习路线图和本书内容,为后续高效学习Spark编程打下基础。

本章将重点讲述以下几个问题:

●什么是大数据?它和普通数据有什么不一样?

●大数据开发分为哪几个步骤?

●大数据开发的各个环节中分别涉及哪些技术?

●Spark是什么?它是用来干什么的?它位于大数据开发的哪个环节?

●Spark相对于其他大数据处理技术,有哪些特点?

●Spark的重要组件有哪些?其作用分别是什么?

●Scala是什么?为什么用Scala来开发Spark框架和Spark应用?

●使用Scala开发Spark应用涉及哪些技术?

●学习Spark需要掌握哪些技能或知识点?

●如何快速学习Spark?