2.2 利用Power BI进行数据分析的流程
利用Power BI进行数据分析,通常分为6个环节,如图2-6所示。
图2-6 利用Power BI进行数据分析的流程
在图2-6中,业务理解是数据分析的起点。制作报告需要考虑的是:要解决哪些业务问题,涉及哪些业务指标,从哪些业务角度分析,分析的逻辑框架如何构建等。上述问题的解决就要求数据分析师对公司常用的指标、维度、分析场景了然于胸。
业务场景梳理完成后,就要有针对性地获取数据。由于业务的复杂程度不同,数据可能存在于多个业务系统、数据库或是Excel文件中;如果涉及市场环境、竞争对手、天气等分析场景,还要从网络中抓取数据。Power BI可以连接的数据源有数百个,它强大的数据获取能力可以让我们连接并获取到合规前提下我们所需要的几乎任何数据。
获取到的Power BI原始数据可能在数据结构、数据格式上并不能满足分析需求,甚至可能存在一些错误值。因此我们需要对数据进行一系列的加工、处理,用于生成符合条件的标准化表格。其中,常用的数据转换步骤包括字段的拆分、合并,字段信息的提取、数据类型转换、数据筛选、数据替换、多表合并等。数据转换是在Power Query中进行的。将原始数据导入Power Query,进行数据转换并检查无误后,加载到Power BI Desktop中进行数据建模。
在Power BI Desktop中建立数据模型,主要是构建表间关系。通常加载到Power BI Desktop中的各张表之间并不存在任何关系,我们可以根据客观的业务逻辑,将各表间相同的字段进行关联,从而将各张表连接成一个包含丰富的业务分析维度及客观事实数据的大平表,后期就依据该表进行一系列的业务分析。如果原始的表格及字段不能满足分析需求,还可以新建表及计算列,以丰富分析的维度。对于报告中涉及的各项数据指标,需要通过新建度量值,精准地定义其业务含义。
数据模型建立完成后,就可以拖曳各项维度字段及度量值,进行数据分析,制作可视化报告。如果说数据建模环节倚重于对技术知识的精通,那么报告制作环节则更依赖于业务知识的积累。
对以下问题进行周全的考虑及精细化的设置,才能真正设计出一份满足业务需求的可视化报告。
● 分析的主题需要用到哪些指标?从哪些维度展开?
● 使用哪个可视化对象展现会使报表更加简明、清晰?
● 切片器如何设置?
● 哪些图表需要设计表间联动、下钻?
● 整个页面如何布局,才能全面展示问题也不会拥挤或冗余?
● 页面如何配色,才能清晰地展示分析结果且在风格上契合报告的展示场合?
最后一个环节是报告发布。可以通过Power BI Service、Power BI 移动端将报告发布到云端,或者将报告链接分享至微信,便于随时随地查看,获得即时见解。