1.6 教学建议及教辅资料
大数据涉及基础技术较多,要在一本书中涵盖所有知识点是非常困难的。本书内容围绕Hadoop生态圈中核心技术展开,旨在让读者掌握大数据的基本概念、原理与方法。通过本课程的学习能够做简单的应用开发,为深入学习后续相关课程打下坚实基础。
若要掌握大数据基础技术,读者应学习Java语言、数据结构、熟练Linux命令并了解TCP/IP协议的相关知识。根据以往的教学经验,本书在第2章增加了Linux基本操作一节,并在假设读者学习过Java语言的基础上补充了可能在学习中被忽略的泛型、Java集合类、反射等Java语言知识。同时考虑到本书中多处使用SQL或类SQL,在第2章也增加了SQL基础内容。本书适合作为教材使用,教师可以根据学生实际情况增删,但不建议学生在没有掌握相关基础的情况下贸然开始学习3章以后的内容。建议课堂教学48学时,上机32学时,教师可根据实际教学情况进行调整。例如第8章有关Spark的知识,相对独立,可以略讲或不讲;第9章,若学生没有Javascript和Web开发经验也可以略过。具体建议如下。
第1章 大数据概述 2学时
第2章 大数据软件技术基础 4学时 + 上机4学时
第3章 大数据存储技术 6学时 + 上机4学时
第4章 MapReduce分布式编程 6学时 + 上机4学时
第5章 数据采集与预处理 4学时 + 上机4学时
第6章 数据仓库与联机分析技术 6学时 + 上机4学时
第7章 数据挖掘与分析技术 4学时 + 上机4学时
第8章 Spark分布式内存计算框架 6学时 + 上机4学时
第9章 数据可视化技术 6学时 + 上机4学时
第10章 大数据安全 4学时
本书配套教辅资料和实验环境等资料,可以通过人民邮电出版社的人邮教育社区(www.ryjiaoyu.com)下载或者通过Email与作者联系:zdxue@isyslab.org。