在统计分析中,有时需要对数据中变量之间的关系进行探索。当变量都是数值变量时,我们通常会依据不同的变量数,选择散点图或气泡图进行数据可视化。
散点图就是由一些分散点组成的图形,这些点的位置(横纵坐标)分别由两个数值变量的值来确定。
气泡图是用于展示三个数值变量之间关系的图形,它是在散点图的基础上增加一个维度,即用散点大小表示第三个维度上数值的大小。
例3-5 表3-5列示的是不同地区的“林业用地面积”“人均可支配收入”“财政收入”数据,请选择数据可视化形式呈现“人均可支配收入”与“财政收入”的关系,并进一步用可视化的方式呈现三个变量。
表3-5 不同地区的林业用地面积、人均可支配收入、财政收入
注:数据经过处理(忽略单位)。
分析: 第一个任务是呈现“人均可支配收入”与“财政收入”的关系,两者都是数值变量,因此选择散点图就可以了。
散点图操作流程(Excel 2016):
全选数据(变量:“人均可支配收入”和“财政收入”)→单击菜单“插入”→单击“插入散点图或气泡图”→单击“散点图”
散点图及其图表元素如图3-11所示。
图3-11 散点图及其图表元素
从这幅散点图中我们可以大致判断出,这两个变量在数值上存在相关性,财政收入越大的地区,其人均可支配收入大概率也越高。这部分线性相关性的概念,我们将在后续的章节中深入探讨。
当把“林业用地面积”考虑进来时,我们就需要在原来的散点图基础上再增加一个维度,这个维度可以用散点的大小来表示,这时候就得到了气泡图,如图3-12所示。
图3-12 气泡图
气泡图操作流程(Excel 2016):
单击菜单“插入”→单击“插入散点图或气泡图”→单击“气泡图”→得到空白图→右击空白图并单击“选择数据”→单击“添加”(见图3-13)
图3-13 选择数据窗口
在“X轴系列值”的区域框选中“人均可支配收入”所有数据(不包括标题),在“Y轴系列值”的区域框选中“财政收入”所有数据,在“系列气泡大小”区域框中选中“林业用地面积”所有数据,并单击“确定”按钮(见图3-14)。
图3-14 添加数据窗口