上QQ阅读APP看书,第一时间看更新
三、设计分析框架
1.了解数据表的类型
在Power BI中,数据表分为事实表和维度表两类。
事实表主要存放用于度量或计算的数值信息,数据量往往很大,销售数据表就是一个非常典型的事实表。事实表存放数据的基本原则是不管发生多少笔交易都必须如实地记录下来。维度表主要存放用于分组或分类的字段信息,数据量较小。
数据分析的本质就是通过不同维度表中的各个维度对事实表中的数据进行分析。
2.数据表设计
根据以上理解,我们将苏苏奶茶数据表设计为三个维度表(产品表、门店表、日期表)和一个事实表(销售数据表)。每张数据表都设有一个主键,如产品表中的“产品ID”、门店表中的“门店ID”、日期表中的“日期”、销售数据表中的“订单编号”都是所在数据表的主键,被设为主键的字段值是不能重复的,也不能为空值,它能够唯一标识数据表中的一条记录。各数据表的详细信息如下。
(1)产品表
产品表包括产品ID、产品分类、规格、产品名称、单价、单位成本信息,共12条记录,如表2-2所示。
表2-2 产品表
(2)门店表
门店表包括门店ID、门店、省份信息,共22家门店,如表2-3所示。
表2-3 门店表
(3)日期表
日期表包含日期和年份季度两列,如表2-4所示。
表2-4 日期表
续表
(4)销售数据表
销售数据表包括订单编号、订单日期、门店ID、产品ID、会员ID和数量信息,共20788条销售记录,如表2-5所示。
表2-5 销售数据表
遵循数据分析的基本流程,应用Power BI的工作过程大致分为以下四个步骤:首先是获取数据;其次是整理数据;再次是构建数据模型;最后是制作可视化报告。