树状图用于展示不同层级数据的分布情况。例如,为了展示CEO的学历/学位和专业的分布情况,先按专业分为人文社科和理工类两大组,然后在各个专业内部按学历/学位分组,统计两个层级中各个组的人数。绘制树状图,以展示各层级数据的分布差异。
数据文件:CEO.xlsx。
要求:用树状图呈现上市公司CEO的专业背景、学历/学位的层级分布情况。
创建一张层级数据透视表。在“数据透视表字段”窗格中,将字段“专业背景”和“学历/学位”拖曳至“行”框中,将字段“序号”拖曳至“∑值”框中,将汇总方式设置为“计数”,如图2.12所示。
图2.12 层级数据透视表
将图2.12中的数据透视表的内容复制、粘贴、排序后,得到图2.13中单元格区域“A21:C30”中的3列数据。单击“插入”→“层次结构”,选择“树状图”,生成树状图。单击图中矩形区域设置图形色调,添加数据标签。如图2.13所示,树状图中矩形的面积大小代表各个组的人数。小矩形面积占对应大矩形的面积的比重,可以反映一个组数据在上一层级数据中的比重。
图2.13 按专业背景、学历/学位分组的树状图
可以根据树状图比较人文社科组和理工科组中CEO的学历/学位分布差异。在这两个组中,硕士的人数最多,但是人文社科组中大专的比重高于理工科组中大专的比重,博士的比重低于理工科组中博士的比重。
若将CEO先按学历/学位分组,再按专业背景分组,可生成层级结构数据。按照前述步骤,创建树状图。此时,树状图中矩形的排列与图2.13中树状图中矩形的排列不同,展示了不同学历/学位组中的CEO专业背景分布的差异。从图2.14可以发现,硕士、本科、大专、中专及以下这4个组中,人文社科的比重大于理工科的比重,博士组中理工科的比重大于人文社科的比重。
图2.14 按学历/学位、专业层级分组的树状图
实操技巧
● 创建层级结构的分组数据频数分布表,为绘制树状图做好数据准备。
● 改变层级数据的层级顺序,可以调整树状图的布局。