前言
传统零售数据分析的困局
传统的零售数据分析方法,通常是由数据分析师根据业务分析需求,将分散在各个业务系统中的历史数据导出到Excel表格,用Excel工具对数据进行加工处理,并将缺失的信息匹配完整后,进行数据透视,生成最终需要的分析报表。此种分析方法有以下几大弊端。
(1)报表制作花费时间过长,数据分析师几乎没有时间对报表结果进行高价值的业务分析。一个业务报表,80%~90%的时间花费在数据的收集、处理及数据结果的核对上,而对报表结果的深入挖掘只占10%~20%的时间。
(2)报表的可复用性较差。虽然日报、周报、月报的制作方法类似,甚至相似主题的分析报表其逻辑框架也基本相同,但很多企业的数据分析专员依然是每日重复相同的工作,即收集、整理数据及核对结果。长期来看,数据分析专员对企业产生的价值有限,自身能力毫无提升。
(3)处理的数据量级有限。使用Excel进行数据处理和分析,几万行的数据基本上毫无压力,但是当数据达到几十万行时,Excel的运行效率会显著下降,出现严重卡顿。而对于百万行量级的数据,由于超出了Excel工作表约104 万行的限制,在Excel中甚至无法计算。在真实的企业环境下,如果分析得足够深入,比如分析销售额背后商品、会员、单据等数据的变化规律,或者分析的时间区间足够大,比如分析一整年或者数年的销售变化趋势,那么基础数据的量级很容易突破百万行。以上这些分析场景都是难以通过Excel处理的。
(4)分析的指标相对简单且数量有限。Excel 透视表中自带的分析指标只有求和、计数、平均值、最大值、最小值及统计中常用的方差、标准差等,对于业务逻辑稍微复杂的指标,需要在透视表外进行二次计算。比如对于单据数的计算,由于在销售表中单张单据可能包含多个商品,因此单据编号会重复出现,这样在计算单据数的时候,就不能简单地对单据编号计数,而要去重后再计数。在统计单据数的过程中,如果包含一些对于单据是否有效的判断逻辑,数据处理过程会更加复杂。
(5)在一些相对高级的Excel 分析中,已经引入了比较成熟的模板概念,很好地解决了报表复用的问题。每次只要把新的数据追加到表格末尾,刷新后就会出现最新的分析报表,但这依然无法解决数据量大和分析指标简单、有限这些痛点。而且在将新数据追加到分析模型之前,往往需要对数据做一系列的前期处理工作,将基础数据进行聚合运算,分成几个主题后再进行追加。这样,一方面工作量会增加,另一方面,数据聚合的过程也会伴随着数据颗粒度(即数据的细化程度)的增大而无法进行深入分析。
(6)如果既要保持基础数据时间跨度足够大,又要数据颗粒度足够小,往往要借助IT的力量,使用数据库或数据分析软件。通常情况下,IT 人员擅长编写代码,对企业经营业务接触较少,IT人员做出的报表往往难以满足业务分析的需求,且一旦增加新的需求,分析周期也相对较长。这样,分析报表在专业度、时效性、灵活性等方面都会大打折扣。
正是基于对传统零售数据分析所存在的种种痛点的深刻反思,借助微软强大的商业智能分析软件Power BI,我们搭建了一套零售行业通用业务模型,以辅助业务人员准确、高效地进行零售数据分析,助力推进企业的数字化进程。
成书背景介绍
本书中虚构了一家专营女装的大型服装公司,公司日常的分析工作主要集中在运营分析、商品分析和会员分析三大领域。随着市场竞争的加剧、业务需求的复杂化以及新型业务的不断增加,公司管理者对业务报表的专业度和时效性的要求也在不断提高。但是利用传统的数据分析工具及分析方法,业务人员每天要花费大量的时间从诸如ERP、POS、SAP 等业务系统导出数据并进行数据清洗和整合,效率非常低;对于一些时间跨度较大或分析粒度过小的业务需求,数据量经常会超过单张Excel 表格的限制,只能将数据按照某个维度拆分后分别进行分析;同一个业务指标,不同部门汇总上来的结果往往有或多或少的偏差;对于公司管理者提出的一些高级业务需求,比如购物篮分析,业务人员完全没有办法实现。
现有的数据分析工具及分析方法已经远远无法满足企业快速发展的需求,对散落在各个业务系统中的数据的高效整合,即时、专业、统一的业务报表及数据模型的构建,以及业务人员自主高效地通过拖曳来生成报表以解决一些临时的问题等,是企业数字化转型升级之路的迫切需求。基于对国内外商业智能分析工具的调研比较,笔者发现微软推出的Power BI能够非常完美地契合企业数字化转型的需求。本书将详细介绍利用Power BI搭建零售数据分析模型,以及运用数据分析模型指导企业业务运营的过程。
如何使用本书
不同于绝大多数讲解Power BI技术的图书,本书的侧重点是讲解Power BI 在零售行业内业务领域的实战。书中各章讲解的案例,“分”则是一个个独立的业务应用场景,“合”则是一整套前后衔接、逻辑清晰的零售业务解决方案。无论您是在零售行业打拼多年的职场“老兵”,还是Power BI的技术“达人”,抑或是入门Power BI数据分析的新人,本书都会为您现有的知识结构提供强有力的补充和帮助。
本书使用的数据源以及数据源中所包含的业务字段均经过了仔细的考量、筛选,能够涵盖绝大部分零售数据分析场景。在阅读本书之前,建议您首先在异步社区下载案例数据源,按照书中讲解的操作方法,边读边进行实操演练,从而加深理解。另外,我们还建立了零售数据分析学习交流群,通过扫描右侧的二维码即可入群学习、交流,探讨与零售业务相关的问题及与Power BI相关的技术问题,以不断拓展利用Power BI进行零售数据分析的各类应用场景。
最后,书中有几点可能会使您在阅读中产生一定的困惑,在此统一做说明。
(1)书中数据模型刷新日期是2019年8月20日,所有的业务发生日期都是截至该日,所以很多趋势分析图表中2019年的数据并不完整,只有1月到8月的数据,这个是由以上业务设定所导致的,并非数据缺失。
(2)书中部分图表展示的数据,个体的总和与合计有微小差异,这是由于软件对展示的小数位数进行了四舍五入处理,并非数据计算有误。
(3)书中涉及“率”的公式,为了计算和表示方便,统一没有乘以100%。