临床研究的样本量通常是通过控制Ⅰ类错误(或置信区间)和Ⅱ类错误(或检验效能)来确定。对应于Ⅰ类错误和Ⅱ类错误,样本量估计通常由精度分析(precision analysis)或效能分析(power analysis)的计算公式反推得到。
由统计理论知,置信区间是按照预先给定的概率(1- α ),由样本统计量所构造的总体参数的估计区间。预先给定的概率(1- α )称为置信度,它表示 H 0 成立时不拒绝 H 0 的概率大小。在给定检验水准 α 的前提下进行统计推断,置信区间法与假设检验常常是等价的,因而可以利用参数的置信区间来确定所需样本量大小。精度分析就是要确定在(1- α )×100%的概率水准下研究者可以接受的总体参数的置信区间的最大半宽,而置信区间的最大半宽通常指的是未知总体参数的最大抽样误差。
精度分析法的基本原理为:设
y
1
,
y
2
,…,
y
n
是服从正态分布的独立同分布的随机变量,记为
y
i
~
N
(
μ
,
σ
2
),若总体标准差
σ
已知,则总体均数
μ
的双侧(1-
α
)×100%的置信区间为
,其中
u
α
/2
为标准正态分布的上(
α
/2)×100%分位点对应的界值。则可接受的最大抽样误差
E
为:
进一步得到所需的样本量 n :
例如,设某研究者希望在95%的置信度下估计得到的样本均数标准误小于总体标准差的1/10(0.1 σ ),即:
因此,所需样本量
。
上述的分析思路同样适用于服从二项分布的样本资料,也可以方便地推广到两处理组比较的样本量估计中。
在临床研究中,相较于Ⅱ类错误来说,Ⅰ类错误常常被认为是更重要和/或更严重的一类推断错误。在进行假设检验时,常规做法是在通过设定检验水准 α 以控制Ⅰ类错误,并在此前提下通过选取合适的样本量以保证足够的检验效能(1- β )。基于此种思想,可通过首先推导检验统计量的计算公式继而反推样本量的方法称为效能分析法。
采用效能分析法进行样本量估计的思路如下:
令 x i , i =1,…, n 1 和 y i , i =1,…, n 2 分别表示试验组和对照组的样本观测, x i 和 y i 均是服从正态分布的独立同分布的随机变量,且 x i ~ N ( μ 1 , σ 1 2 ), y i ~ N ( μ 2 , σ 2 2 )。试验目的是验证试验组的效应是否优于对照组。若研究不设定优效界值,其检验假设为:
为简单起见,设
和
均已知(可通过预试验或历史数据估计得到)以及
n
1
=
n
2
=
n
,则可基于两样本
Z
检验进行组间比较。检验统计量
u
的计算公式为:
在 H 0 成立的条件下,检验统计量 u 服从标准正态分布,即 u ~ N (0,1)。因此,当| u |> u α /2 时拒绝原假设。
若 H 1 成立,设 μ 1 = μ 2 +Δ(其中Δ表示有临床意义的差值,不失一般性,令Δ>0),根据公式(7-4),得 u ~ N ( μ * ,1),其中:
由正态分布的理论可得,
为使试验达到预设的检验效能(1- β ),则需令 u α /2 - μ * =- u β ,因此可得
此即为估计得到的本研究每组所需的样本量。