苏苏奶茶是一家主营奶茶的连锁零售企业,创建已有两年,主营椰果奶茶、芋圆奶茶、红豆奶茶和炭烧奶茶四个品种,每种奶茶售卖时又分为大杯、中杯、小杯三种规格。
苏苏奶茶采取直营销售模式,已在全国不同省份建立了22家直营门店,且保留了2021年、2022年两年的全部销售数据。
新的一年到来之际,公司管理层希望通过对两年的销售数据进行分析,发现问题,寻找业务增长点,确定企业战略和发力点。为此,管理层需要了解以下几个问题。
① 哪种品牌的产品更受欢迎?它们各自的贡献度是多少?
② 哪种产品更受欢迎?各产品排名情况是怎样的?
③ 销售目标达成了吗?
④ 销售情况与不同年度、季度、月份有关联吗?
⑤ 客户数量增长情况如何?
决策需要数据支持。将企业上述管理需求转化为清晰的数据需求,如表2-1所示。
表2-1 将管理需求转化为数据需求
通过需求解析可以看出,所需的数据支持大部分是从不同角度、不同维度对销售额、销售量等数据进行深入的观察与分析。
在Power BI中,数据表分为事实表和维度表两类。
事实表主要存放用于度量或计算的数值信息,数据量往往很大,销售数据表就是一个非常典型的事实表。事实表存放数据的基本原则是不管发生多少笔交易都必须如实地记录下来。维度表主要存放用于分组或分类的字段信息,数据量较小。
数据分析的本质就是通过不同维度表中的各个维度对事实表中的数据进行分析。
根据以上理解,我们将苏苏奶茶数据表设计为三个维度表(产品表、门店表、日期表)和一个事实表(销售数据表)。每张数据表都设有一个主键,如产品表中的“产品ID”、门店表中的“门店ID”、日期表中的“日期”、销售数据表中的“订单编号”都是所在数据表的主键,被设为主键的字段值是不能重复的,也不能为空值,它能够唯一标识数据表中的一条记录。各数据表的详细信息如下。
(1)产品表
产品表包括产品ID、产品分类、规格、产品名称、单价、单位成本信息,共12条记录,如表2-2所示。
表2-2 产品表
(2)门店表
门店表包括门店ID、门店、省份信息,共22家门店,如表2-3所示。
表2-3 门店表
(3)日期表
日期表包含日期和年份季度两列,如表2-4所示。
表2-4 日期表
续表
(4)销售数据表
销售数据表包括订单编号、订单日期、门店ID、产品ID、会员ID和数量信息,共20788条销售记录,如表2-5所示。
表2-5 销售数据表
遵循数据分析的基本流程,应用Power BI的工作过程大致分为以下四个步骤:首先是获取数据;其次是整理数据;再次是构建数据模型;最后是制作可视化报告。