购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎

2.4
条形图

条形图(bar plot)是用图形显示变量频数、平均数或其他统计量的常用方法。条形图的R函数为barplot。这个函数包括的最基本变元是数值向量x和names.arg(类别/因素名称/水平名称)。通常还会增加其他变元,如主标题(变元main)。

假如某研究者调查100名英语专业学生对专业课程设置的满意度。满意度采用5点式Likert量表(five-point Likert scale):1=“非常不满意”,2=“不满意”,3=“一般”,4=“满意”,5=“非常满意”。调查结果表明,由“非常不满意”到“非常满意”的学生人数依次为:12,11,45,14,18。试用条形图显示不同类别的频数。执行以下R命令得到如图2.11所示的结果:

>par(mai=c(0.36,0.4,0.2,0),omi=c(0,0,0,0),cex=0.8)

>Freq<-c(12,11,45,14,18)

>Category<-factor(c(1,2,3,4,5),labels=c('非常不','不','一般','满意','非常满意'))

>Mydata<-data.frame(Category,Freq)

>Order<-Mydata[order(Mydata$Freq),]

>barplot(Order$Freq,names.arg=Order$Category,main='满意度比较',cex.main=1.1)

图2.11 条形图

以上命令中,函数order用于将五个类别的频数由小到大排序,便于图形分析。函数barplot中的变元cex.main用于设置主标题的大小。如果想要将条形图横放,则在函数barplot中增加变元horiz=TRUE即可。

在绘制连续性变量平均数或其他统计量时,通常要考虑增加其他数据信息,使图形能够更多地揭示数据特征。在条形图中增加95%置信区间(confidence intervals, CI )是常见的做法。要在R中绘制置信区间,则需安装与调用数据包gplots。绘制改进的条形图的R函数为barplot2。该函数包括的最基本变元是数值向量x和names.arg(类别/因素名称/水平名称)。通常还会增加其他变元,如线型网格(变元plot.grid)。

假如某研究者得到以下关于某个因素G三个水平(G1、G2、G3)上连续性变量测量的平均数(Mean)和95%置信区间( CI )值:

Mean<-c(11.6,7.1,8.7)

CI<-c(11.04,12.16,6.49,7.71,7.23,10.17)

试用包括95%置信区间的条形图显示不同类别上的平均数。执行以下R命令得到如图2.12所示的结果:

>par(mai=c(0.36,0.4,0.2,0),omi=c(0,0,0,0),cex=0.8)

>require(gplots)

>Mean<-c(11.6,7.1,8.7)

>CI<-c(11.04,12.16,6.49,7.71,7.23,10.17)

>barplot2(Mean,names.arg=c(' G1',' G2',' G3'),plot.ci=TRUE,ci.l=c(11.04,6.49,7.23),ci.u=c(12.16,7.71,10.17),ci.width=0.2,plot.grid=TRUE,grid.lty='dotted')

在函数barplot2中,逻辑变元plot.ci设为TRUE,绘制置信区间,变元ci.l和ci.u用于设定置信区间的下限(lower bound)和上限(upper bound);ci.width用于设置置信区间线段(line segment)端点外延长度。设置逻辑变元plot.grid=TRUE,绘制线型网格,目的是便于更精确地目测平均数和置信区间上下限的大小。

图2.12 包括95%置信区间的条形图 clZXGXUW11B+xiIS188UF6Umv36/FkjUArTkFsNKFNWy0JvygQozbM8n3Op9T6fK

点击中间区域
呼出菜单
上一章
目录
下一章
×