前言
21世纪初,大数据及其相关的应用迅速在全球成为潮流,而提高我国信息化、数字化水平,促进企业实现数字化转型也上升为国家发展战略的重要组成部分。业界对数据应用类人才的需求高峰随之而来。高校对此做出了迅速响应,2016年以来,已有数百所高校陆续申请建立了大数据相关专业。但市场的人才需求并没有得到有效满足,特别是那些运用数据解决实际问题的人才总是供不应求。造成这种供需错位的主要原因在于,实践中的数据分析工作需要的是“数据与业务的双语者”。传统的高校教学非常擅长解决“数据”的部分,但在“业务”方面的经验相对有限。学生虽然学到了很多知识,但尚未具备将其融会贯通以解决实际问题的能力。
相关专业的教师在教学中开展了多样化的尝试以解决上述问题,如通过案例教学将数据科学实践领域的各种内容引入课堂。但这些尝试多局限于某些课程模块中,将专业知识系统地与实践工作融为一体的课程似乎仍不多见。党的二十大报告指出:实践没有止境,理论创新也没有止境。商务数据分析作为一项理论与实践联系紧密的学科,每一步创新也是如此。为此,编者萌生了编写这样一本教材的想法:以实践领域中的工作方法为主线,介绍与数据分析相关的基础知识和基本技能,并通过解决真实问题的训练来帮助学生掌握相关知识,提高学生解决问题的能力。这样的设计可以帮助学生尽早开始理解和解决未来在实践领域中将会面对的“知易行难”的问题,也能够为企业提供更多高质量的人才。
为了实现培养“数据与业务的双语者”这个目标,本书主要进行了以下设计。
首先,以实践领域中数据分析类工作的流程为主要脉络展开。第1章介绍实践中数据分析的工作流程;第2章~第6章按照数据分析工作流程编排章节内容,并详细介绍专业知识和实操技能;第7章融汇全书内容进行强化训练。
其次,在每章中都安排“实践练习”环节,引导读者使用本章及前面各章学习过的知识和技能来解决实际问题。通过这样的训练,读者可以建立各种实际问题和数据问题之间的对照关联,培养和提高应用数据专业知识和技能解决实际业务问题的能力。
最后,本书选择Excel作为数据分析的工具。Excel可以说是所有数据分析工具中学习成本最低的一种,可以广泛地帮助需要掌握数据分析技能的人。当前,基础数据分析技能正在成为如操作计算机和办公软件一样普及的办公室基本技能。对于那些非数据分析专职,但也承担大量数据分析工作的人员,Excel 或许是可以最快上手的工具。对于具有数据科学类专业背景的人员,本书中的工作方法和实践练习仍然可以帮助其继续提升,且读者可以用自己熟悉的工具来完成书中安排的练习。
本书各章的具体内容如下。
第1章介绍实践中的商务数据分析工作概况,以及基本的工作流程和对从业者的能力要求,帮助读者理解全书脉络。“实践练习”环节要求读者对自己的职业发展进行规划,进一步加深对全书内容的理解,初步建立专业知识与实践领域的关联。
第2章介绍如何设定分析目标,这是从事商务数据分析工作的第一个步骤,决定后续所有工作的方向和价值。“实践练习”环节要求读者将自己在设定目标过程中了解到的相关信息进行整理,并基于整理结果写作数据报告的背景介绍部分。写作训练需要读者进一步整理和辨析自己掌握的信息,这对于厘清思路非常有帮助,这种训练将贯穿之后的每一章。
第3章介绍如何获取、验证和加工数据,这是从事商务数据分析工作的第二个步骤。在这个阶段读者要解决是否有数据、数据质量是否过关、数据用起来是否方便3个问题。“实践练习”环节要求读者对一份互联网广告展现数据进行数据质量评估和数据加工,并根据工作过程撰写数据分析报告的数据说明部分。
第4章和第5章分别介绍探索数据基本特征的方法和两种常用的数据模型,这是从事商务数据分析工作的第三个步骤。第4章的内容几乎在所有数据分析工作中都会涉及,尤其是在企业中对各项工作进行日常监控的场景里,绝大部分数据分析工作都与这一章介绍的内容有关。“实践练习”环节要求读者基于各国家/地区性别差异的数据完成描述性分析并撰写报告。第5章讲解实践中常用的两种模型:线性回归模型和逻辑回归模型。它们的构建思路都非常经典,理论相对简洁,是投入产出比非常高的学习对象。“实践练习”环节选取一个知识经济领域的问题,要求读者通过建模来回答哪些知识工作者有可能成为广受欢迎的“网红”。
第6章对展示数据分析工作成果的工具数据产品进行概要介绍,并重点介绍一种重要的数据产品—数据分析报告的写作。撰写数据分析报告是数据分析师形成自身影响力的关键工具。“实践练习”环节要求读者基于第3章~第5章中的任何一个案例完成一份完整的数据分析报告。
第7章要求读者自己选题并完成一个完整的实践项目。这是对全书内容的综合应用和强化训练,读者不但要将全书的内容融会贯通,还要进一步强化自己在知识与实践问题之间进行对照关联的思考习惯和工作方法。
作为高校教学的教材,本书可支撑3~4学分的课程,在教学过程中可配合大量汇报、演示环节以进一步加强学生的实践技能,期末通过案例项目汇报考核。下表所示是课程安排的基本建议。
课程安排
本书由王汉生担任主编,常莹、朱振涛编著。非常感谢人民邮电出版社的各位编辑的倡议和督促,感谢数据科学智库狗熊会各位同仁的支持,没有各位的鼓励和帮助,本书可能仍是我们脑海中的一个创意。我们在写作时虽然怀有雄心壮志,希望能够将实践领域中与数据分析工作有关的内容尽数传达给读者,但是这个领域非常庞大,而且我们自身能力有限,难免有所疏失,恳请各位读者能够拨冗提出宝贵的意见和建议,意见和建议请发送至ying.chang@clubear.org。
编者