2016-03-18 陶立元 赵一鸣
在上一期中我们讨论了统计表格的制作,本期我们将概括地讨论一下统计图都有哪些类型,分别表示什么含义。在讨论之前,还是要强调一下统计图对研究结果的表达更为直观,将统计数据形象化可以给读者留下深刻的印象。但是统计图一般只能提供粗略的情况,不能提供精确的数据,且信息量有限,因此它不能完全代替统计表的使用。
与统计表一样,统计图的制作也有一般原则:①应根据资料的性质和分析目的选择恰当的统计图;②统计图应该有标题、横标目、纵标目和必要的图例说明,横纵标目分别说明横纵坐标代表的指标和单位;③统计图应该和统计表一样有其“自明性”,即使脱离了原文,单看图表也应该能够充分说明一个问题。
根据不同的分析目的,医学文献中常用的统计图有:条图(bar chart)、饼图(pie chart)、百分比条图(percent bar chart)、线图(line graph)、直方图(Histogram)、统计地图(statistical map)、散点图(scatter plot)、厢式图(box plot)、茎叶图(stem-leaf plot)等。下面分别介绍。
条图也称柱图,是用相同宽度的直条的长短表示相互独立的某统计指标的大小。条图按照分组的层次,可分为单式条图和复式条图,如上图是复式条图。按照直条的方向,可分为卧式条图和立式条图,如上图是立式条图。在上图中,我们还可以看到在每个直条上都有一个工字型的误差条(error bar),可表示该数值的95% CI、标准差或标准误。需要注意的是,在图的下面应该明确指出该误差条所代表的含义。
饼图也称圆图,是以圆的总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。如用它来反映某一疾病多个并发症的构成比例等。
百分比条图是以总长度为100%,将各构成比乘以总长度得到各构成的长度。其作用与饼图类似,都是用来反映不同类型构成比的情况。
线图是用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变量变化的趋势,常用于描述统计量随时间变化的趋势。在线图中也可加入误差条,其意义与条图一致。
直方图是以各直方面积描述各组频数的多少,面积总和相当于各组频数之和。直方图的横轴尺度是数值变量值,纵轴是频数。直方图可用来观察某一个指标取值的频数分布情况,也可用作某一指标是否符合正态分布的参考。另外,如果以各组取值的频率作为纵坐标轴作图,便称为频率直方图,其意义和直方图类似。
统计地图是用不同的颜色或花纹表示统计量的值在地理分布上的变化,适宜描述研究指标在不同区域的地理分布。作此类图形,首先需要统计软件对该地区地理信息(地图)的支持。
散点图是使用散点来表示两个连续性变量之间的关系,可用于两个变量的相关分析或回归分析,也可用绘制复式散点图(如上图)来分析不同分组之间两个变量的相关关系是否一致等等(上图中不同颜色代表不同的分组)。
箱式图是用数据的最小值(或均数减1.5倍四分位数间距)、25%位数、50%位数、75%位数、最大值(或均数加1.5倍四分位数间距)和离群值(在图的外部用星号或圆圈表示)来反映原始数据的分布情况。箱子越长数据变异程度越大,若中间横线在箱子中间则表明数据分布对称。
茎叶图是将数据分成两个部分,即整数部分和尾数部分。如上图,左边是茎的数值,茎宽一般标在图的下方;右边是叶,图显示每个叶的尾数数值,同样在图的下方标示每个叶代表几个实际观察值(即频数)。茎叶图可以非常直观地显示数据的分布范围和形态。