在效应量、样本量、显著性水平和统计效力之间的关系中,知道其中的三个参数值,通常可得到另外一个参数值。任何一个参数值的变化都会对其他参数值产生影响。在研究设计中,R函数pwr.norm.test可用于确定保证统计效力(1- β )所需的样本量。在元分析(meta-analysis)或研究的后续分析中,该函数可用于检验在现有的效应量和样本量条件下研究实际得到的统计效力。由于研究中通常将第一类错误率 α 设为0.05,采用双侧检验,在保证统计效力不低于0.8的情况下确定恰当的样本量至关重要。
假如有两个来自正态分布的总体,标准差均为 σ =5,零假设是 μ = μ 0 =10,研究假设是 μ = μ 1 =12。如果 α =0.05,采用双侧检验,试求在研究假设为真时不同样本量条件下( n =10,20,…,190,200)的统计效力。在正态分布总体方差已知的情况下,可以根据函数pwr.norm.test来计算不同样本量条件下的统计效力。效力与样本量的关系如图4.5所示。
整体上看,随着样本量的增大,统计效力在增加,变化的速度由快到慢。在样本量小的时候,统计效力变化快。譬如, n =20时,统计效力约为0.4,但是 n =30时,统计效力接近0.6。如果按照统计效力应达到0.8的标准,则样本量应在50左右。如果希望统计效力达到0.9的标准,样本量在70左右即可。当样本量达到100之后,统计效力随样本量的变化幅度减缓,增加样本量的意义不大。
图4.5 统计效力与样本量之间的关系