在统计分析中,我们经常需要对数据进行分组比较,以此为统计决策提供依据。比较又分为静态比较和动态比较,其中,静态比较是指对相同或相近时间点的数据进行比较;动态比较往往是指在不同时间点上进行比较,通常需要比较两组或两组以上数据的趋势。
1.静态比较
在静态情况下,统计分析的任务通常是对相同或相近时间点上,不同分类变量水平下数值变量的比较,此时柱形图是较好的选择。
柱形图又称为长条图,是指以长方形的长度表示不同分类变量水平数值的统计图形。该可视化形式通常被用于规模较小的数据集分析。柱形图也可横向排列,此时通常被称为条形图。
例3-2 表3-2列示的是某百货商店某年1月的销售额数据,现在需要比较不同品类商品的销售额,应该选择什么样的可视化形式?又该怎么做?
表3-2 某百货商店某年1月的销售额数据
分析: 在这个数据中有两个变量,一个是分类变量(品类),另一个是数值变量(销售额)。为了比较不同品类的销售额,可以选择柱形图或条形图。
柱形图操作流程(Excel 2016):
全选数据→单击菜单“插入”→单击“插入柱形图或者条形图”(见图3-2)→单击“二维柱形图”→单击“簇状柱形图”
柱形图及其图表元素如图3-3所示。
图3-2 “插入”菜单中的“插入柱形图或者条形图”
图3-3 柱形图及其图表元素
条形图操作流程(Excel 2016):
全选数据→单击菜单“插入”→单击“插入柱形图或者条形图”(见图3-2)→单击“二维条形图”→单击“簇状条形图”
条形图及其图表元素如图3-4所示。
图3-4 条形图及其图表元素
从柱形图和条形图中我们可以清晰地发现,电子产品的销售额要远高于其他品类的商品。
2.动态比较
在动态情况下,统计分析的任务通常是对不同时间点上数值变量的比较。在这种情形下,折线图是较好的选择。折线图的横轴通常代表时间(如月、季、年),纵轴则是对应时间点的数值。
例3-3 表3-3列示的是两家百货商店2022年和2023年的月度销售额数据,现在需要比较两者的销售额,应该选择什么样的可视化形式?又该怎么做?
表3-3 两家百货商店2022年和2023年的月度销售额数据(单位:万元)
分析: 这显然是一个动态问题,我们可以选择折线图来进行比较分析。
折线图操作流程(Excel 2016):
全选数据→单击菜单“插入”→单击“插入折线图或者面积图”(见图3-5)→单击“二维折线图”→单击“折线图”
图3-5 “插入”菜单中的“插入折线图或者面积图”
这两家百货商店2022年和2023年的月度销售额折线图如图3-6所示。
图3-6 两家百货商店2022年和2023年的月度销售额折线图
从折线图中我们可以得到一些有价值的信息:①百货商店B销售额的离散程度要比百货商店A更大,也就是说百货商店B的峰值更高,谷值更低;②两家百货商店的销售额都存在一定程度的季节性特征,即2月、8月的销售额较高,但5月、11月的销售额较低。