前言
数据已经成为推动现代社会运转的最重要的资源之一,数据科学成为人类探索世界的第四科学范式。不论属于哪个行业,也不论是在工作、学习还是在生活中,人们都时常需要通过对数据进行处理和分析来理解数据背后的知识和规律,从而帮助自己做出更好的决策。
掌握基本的数据处理和分析方法,在数据时代是非常重要的事情。Power BI 是微软公司推出的一款很容易上手而且能力强大的数据处理、分析和可视化工具。Power BI通过内置的Power Query、Power Pivot和Power View三大组件封装了大量的功能模块;同时它以关系模型作为数据建模的基础,使得初学者很快就能够通过关联、计算、度量和可视化等手段对数据中蕴含的事实、知识和规律进行不同角度和层次的抽象和建模,从而更好地理解数据。本书以Power BI为载体介绍数据处理和分析的方法。
☆本书特色
1.以Power BI Desktop为主,内容较为全面,讲解由浅入深
本书先对Power BI完整的产品体系进行介绍,包括PC端的Power BI Desktop、云端的Power BI Service及移动端的Power BI App,使读者可以全面了解Power BI的应用、安装和基本使用方法。然后以浅显易懂的文字和直观的操作截图为主要讲解方式,介绍使用Power BI Desktop 进行数据处理、可视化和分析的方法,同时每个部分都有简单的理论铺垫。本书以从Power BI Desktop简单应用到高级应用的方式进行介绍,通过适当的案例,使不同基础的读者可以根据自己的需要,掌握使用Power BI Desktop进行不同层次的数据处理和分析的方法。
2.注重手动操作方法和使用M语言编写程序进行自动化处理的方法
数据处理是数据分析的基础。Power BI Desktop中的Power Query提供了强大的数据处理能力,包括从不同的数据源获取数据,完成数据清理任务,然后将数据转换成适合进行最终数据分析的数据表形式。在数据处理部分,本书除了介绍基本的数据获取和处理的操作方法外,还重点且较为详细地介绍M语言,并给出了使用M语言解决问题的多个案例。读者可以通过菜单和按钮完成一些基础、强大和重要的数据处理任务,在面对较复杂的数据处理场景时,可以适当使用M语言编写程序,以完成自动化程度更高、逻辑更加复杂的数据处理任务。
3.对数据可视化功能的讲解全面且易于理解
本书对Power BI Desktop的数据可视化功能进行全面的介绍。本书以数据可视化的作用为主线,以Power BI Desktop为载体,使读者掌握从基础到高级的可视化对象的用途和用法,进而在报表中灵活使用这些对象。本书还对Power BI Desktop报表提供的切片器、书签、见解、钻取、聚焦、分组和装箱等高级功能进行了完整的介绍,使读者学会从不同角度对数据进行展示,在数据探索分析、数据建模分析及分析结果展示等不同阶段获得有力支持。
4.在数据建模分析部分注重理论和实践的结合
在数据建模部分,本书兼顾理论和实践。先给出Power BI数据建模的核心思想和方法,接着较为全面地介绍了用于实现数据建模的 DAX 语言,并且按照重要性和难度逐步介绍DAX语言的主要功能函数及其用法,然后从理论角度介绍Power BI的公式引擎和存储引擎,使读者能更加清晰地理解Power BI在数据分析中的数据提取和计算原理;同时结合具体的应用案例,使读者尽可能深入地掌握使用Power BI进行数据建模分析的方法。最后,以几个较为高级的数据分析案例作为结尾:一方面介绍数据分析的常用思路和方法,并给出理论解释;另一方面能够帮助读者熟练掌握使用Power BI进行数据分析的方法。
☆使用指南
本书详细介绍使用Power BI实现数据处理和分析的相关方法和操作,书中内容以数据的获取和处理、数据的可视化和数据建模分析为主线展开,兼顾可视化界面操作和适当的编程实现。书中主要的知识点和实现操作都配有演示视频,扫描二维码即可观看。每章最后都配有和章节内容相关的练习,读者可以根据需要学习相关章节的内容。
本书还配套提供了丰富的教学资源,包括教学PPT课件、教学大纲、数据源、操作视频、习题答案、拓展资料等。
☆编者致谢
本书第1、2、6章由张萍编写,其他章节由黄达明编写。由于编者水平有限,书中难免存在疏漏之处,恳请各位读者批评指正。本书在编写过程中得到了2017年教育部产学合作协同育人项目“以计算思维为导引的数据科学基础”的支持,在此表示感谢!
编者
2022年8月于南京大学