Python+Superset:商业智能数据分析与实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 平台总体需求

BI平台是帮助企业快速有效地从海量的底层数据中抽取数据并进行转换分析的工具,提供一站式从原始数据中挖掘信息的服务,从而降低一线业务人员对技术的依赖度。本部分阐述平台的整体需求,包括平台整体规划、平台用户角色等。

2.2.1 平台总体规划

BI项目平台主要由数据仓库、元数据管理系统、报表平台三大组件组成(如图2-6所示),并结合企业实际情况进行开发。

图2-6 BI项目平台基本构成

1. 数据仓库

数据仓库承担了大多数重要工作,包括将数据分析与源系统的数据分离,创建一组中间表,通过预先汇总数据减少数据分析期间的重复计算,为报表与数据应用提供一致的表头、指标名称等,从而改进数据使用体验。数据仓库是BI平台的核心,也是BI平台的重要组成部分。

2. 元数据管理系统

元数据管理系统的使用者是数据质量工程师和数据分析人员。数据质量工程师主要关心领域内的亲属关系。由于元数据管理系统必须承担元数据更新维护过程中状态流动的推动力,因此在这个方面系统还应该给出待办任务、提醒等支持。数据分析人员主要利用该系统所提供的数据词典,了解目前可用的数据源,并根据自己的理解,给字段以情景化的使用建议。

3. 报表平台

报表平台主要以看板的形式为业务操作、产品等部门及管理人员提供较为固定的指标、趋势等信息。用户可通过点选、更改查询条件等方式对其进行简单的数据研究,有权限的用户也可以给自己的数据源创建看板。

2.2.2 平台用户角色

BI平台是针对企业内用户的。根据用户角色划分,大致可分为:数据分析师、数据质量工程师、数据源负责人、外部业务方、企业管理层等,如图2-7所示。在一般情况下,业务人员是数据需求的提供者,比如业务的领导者、产品经理、企业管理人员等。用户使用BI平台主要通过显示屏浏览各种看板、报表或查看数据大屏等。经过训练之后,这些用户还可以从其授权访问的数据源中抽取某些数据,从而生成报告。

图2-7 平台用户角色

1. 数据分析师

数据分析师是BI平台中最重要的用户,对平台的操作主要包括:对数据进行查询,通过元数据管理系统查询数据字典的具体含义,查询或修改某一数据指标的具体含义和算法,查看数据看板和报表,使用有权限的数据源制作报表等。

2. 数据质量工程师

数据质量工程师的主要任务是保证数据字典和指标信息的及时更新,当异常发生时,及时更新数据字典中的字段,保证指标可用性,确定数据异常的影响范围等。他们在BI平台上的运作都集中于元数据管理子系统,承担诸如角色和权限管理、更新进程、字段可用状态等工作。

3. 数据源负责人

一般而言,后台操作型数据库的开发和设计者对表格的结构和字段的意义最清楚,因此指定他们作为数据源主管是很合适的。如果添加了新表,或者更改了表中字段意义,他们就负责输入和更新这些字段的意义。