随机(random)又称为随机化,是指每个受试对象有同等的机会被抽到样本中或有均等的机会被分配到不同组别中(空白组、实验组或对照组)。随机化贯穿于研究设计和实施的全过程,可以体现在抽样随机化(sampling randomization)、分组随机化(group randomization)和实验顺序随机化(sequence randomization)三个方面。抽样随机化指符合标准的受试对象机会均等地被选择进入研究,使抽样研究的结果及其结论能够代表总体的特性,目的是保证样本的代表性。分组随机化指通过随机方法,使总体中的每一个受试对象都机会均等地被分配到试验组或对照组,其目的是保证样本的均衡性。实验顺序随机化指每个观测对象机会均等地接受处理因素,其目的是平衡观测顺序的影响。
随机化的意义在于使被抽取的观察对象能更好地代表其所来源的总体,并使各比较组间具有最大限度的可比性,从而避免由于主观因素或其他非处理因素造成的偏倚,使结果的真实性受到影响。在医学科研中,一方面要求样本要有很好的代表性;另一方面要求对照组与实验组除研究因素(如服用某种药物)不同外,其他非研究因素(如年龄、性别、病情轻重、疾病分期等)应尽量一致,这是比较的前提。随机化是达到上述目的的主要手段之一。
需要强调的是,随机化抽样可以提高样本的代表性,更好地代表产生样本的总体,减少抽样误差,但不能消除抽样误差;随机分组可以均衡实验组与对照组已知和未知的非处理因素,使两组更具可比性,减少由此引起的混杂偏倚,但不能完全排除。
随机方法有很多,最简单的是抽签或掷币,这两种方法简单易行,但不适合受试对象多的抽样与分组。目前使用较多的随机化方法是随机数字表、随机排列表和计算机产生随机数。
随机数字表(见附表1)常用于抽样研究、受试对象顺序随机以及对病人、实验动物、标本的随机分组,适应范围较广。表内数字相互独立,无论从横行、纵列或斜向等各种顺序均是随机的。使用时可以从任何一行、任何一列开始,可以选1位数、2位数或多位数。
随机排列表(见附表2)尤其适用于随机分组。下面提供了一个 n ≤20的随机排列表(如果 n >20可以参考其他书提供的随机排列表),表内每一行的1~20的前后顺序均是随机排列的,可以选择任意一行使用。
使用Excel软件的排序功能,将受试对象按某一特征(年龄、体重、体质指数等)排序;利用Excel的RAND函数产生随机数,然后再对随机数进行排序;事先规定随机数在哪个范围的作为样本或按排序后的随机数的大小对受试对象进行分组。
随机分组的方法主要有完全随机、区组随机、分层随机、整群随机和半随机。
完全随机(complete randomization)(可用随机数字表、随机排列表和计算机软件随机),是将受试对象按一定特征编号,然后对每位受试对象进行随机数(按单双号、余数、随机数的大小等)(可以1位、2位或多位,最好与受试对象的位数相同)的查找,遇到相同的随机数字,可以保留,也可舍去,按事先规定分组的方法将受试对象分配到各组。如果分配不均,再采用随机数进行调整。
例5-1 试将10只动物应用随机数字表平均分配到甲、乙两组。
①按动物体重由小到大编号;
②从随机数字表的第21行、21列往上查10个随机数;
③规定双号为甲组,单号为乙组;
④调整:再接着查一个“6”以内的随机数,以决定甲组中哪一号拨到乙组。本例查得随机数为4,将甲组第4个(5号)调到乙组。
表5-1 10只动物随机分组(采用随机数字表)
例5-2 拟将15只大鼠随机分入A、B、C三个组,每组5只。
①按动物体重由小到大编号;
②从随机排列表的第5行向右查15个随机数,超过14者弃去;
③规定0~4号分入A组,5~9号分入B组,10~14号分入C组。
表5-2 15只大鼠完全随机分3组结果(采用随机排列表)
完全随机化简便易行,是所有随机化的基础,但由于该方法需要对每个受试对象编号,故当受试对象数量大时较难实行。
区组随机(block randomization),亦称配伍组设计,是配对设计的扩大。随机区组设计是将若干个受试对象按一定条件划分成配伍组或区组,每区组包含多个受试对象,随机地分别给予不同的处理。医学研究中,常将以下情况也按随机区组设计:同一样本用多种方法(仪器)检验,同一受试对象接受某种处理前后多个时点测量,同一受试对象接受多个部位的测量。
例5-3 为比较四种抗病毒药物(甲、乙、丙、丁)的疗效,将小鼠的体重作为区组因素,试分配处理。
①按动物体重顺序排列;
②从随机数字表的第1行,第17~24列开始,同时依次向下查两位的随机数,相同时弃去后者;
③对每一区组的随机数按由小到大的顺序排列;
④序号1、2、3、4,分别对应甲、乙、丙、丁。
表5-3 小鼠区组随机化结果
分层随机(stratified randomization)是指按照研究对象的某个(些)特征分成不同的类别(即所谓的层),然后在不同层别中按随机化方法将其分配到实验组与对照组,提高两组的可比性。
例5-4 将10名缺血性脑中风患者和6名出血性脑中风患者分配到甲、乙两组中。
①分别将10名缺血性和出血性脑中风患者按年龄由小到大编号;
②从随机数字表的第10行第1列向右查10个随机数对应缺血性脑中风患者,从11行第11列向右查6个随机数对应出血性脑中风患者;
③规定双号为甲组,单号为乙组。
表5-4 16名脑中风患者分层随机分组(采用随机数字表)
进入甲组的有缺血性2、6、8、9、10号患者和出血性的1、2、5号患者,其余进入乙组。两组在缺血性与出血性脑中风的比例上相同,减少了由于分类不同带来的影响。
通常将可能产生混杂作用的某个(些)因素作为分层变量,如年龄、性别、文化程度、病情类型等,以减少由此引起的混杂作用的影响。
整群随机(cluster randomization)是以某一个整体为单位随机分组。如在医院里可以单个病房为单位随机分组,即先将病房编号,然后查随机数,按规定的要求分组,其余基本同完全随机化,但它是以病房或某一整体为单位,而不是个体。
整群随机化要求各群内的变异和整个研究对象的变异尽可能相同,而各群间的变异越小越好,提高研究对象的代表性与两组的可比性。
半随机(quasi randomization)是指在临床研究中,可以按照病人的入院日期、门诊号、住院号、受试者生日的单双数等安排组别。当进行大样本研究时,如社区人群的试验,半随机化分配受试者较为简便,同时也能较好地达到组间均衡。临床试验常因研究对象数量较少,半随机化难以达到组间均衡,因而其使用受到限制。而按照患者就诊顺序的单数或双数分组,难以做到随机,因在确定了第1例患者的组别后,就完全可以预知其余研究对象的分组了,与随机事件的不确定性相差甚远。