购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4 其他的实验设计方案

所有的实验设计都具有相同的模式:将受试者随机分为与处理方法数量相同的组数,然后将每一种处理方法应用于其中的一个组。这些实验设计都是完全随机的设计方案。

完全随机设计

在一个 完全随机实验设计 中,所有的实验受试者个体都被随机地分配到各个随机处理组。

一个完全随机实验设计可以拥有任何数量的解释变量。例如,在医生健康研究中有2个解释变量:阿司匹林或者安慰剂;β-胡萝卜或者是安慰剂。在图2-1中显示了这些变量是如何形成4种处理方法的。这项完全随机实验设计将这22 000名受试者的1 /4分配到每一个处理方法所对应的组中。一旦这些处理方法的结构被确定下来,那么这个完全随机实验设计所需要的随机化过程就变得平旦乏味,但是很简单。

分批实验设计

完全随机实验设计是实验研究的最简单的统计学设计方案。它们是单纯随机抽样的类似物。事实上,每一个处理方法所对应的组都是从所有可获得的受试者中的一个SRS样本。完全随机实验设计清楚地说明了 对照、随机和重复 的原则。然而正如抽样过程中,更加精细的统计学设计方案常常更好。特别是那些能够从各个方面都与受试者相匹配的设计方案能够相对简单随机设计方案产生更加精确的结果。

例16 男女运动员免疫功能增强与提高免疫能力的营养补剂。 大负荷的运动训练往往导致男女运动员免疫功能显著下降。但是,男女运动员对于同一种提高免疫能力的营养补剂的反应是不同的。一项实验研究对比了3种提高免疫能力的营养补剂对男女运动员免疫功能的影响,这项研究分别单独观察了男运动员和女运动员的反应,同时也评价了对提高免疫能力的营养补剂的总体反应。

一个完全随机实验设计包括男运动员和女运动员在内的所有的受试者都看作是一个整体人群。这种随机设计将不考虑受试者的性别,而是将他们随机地分配到3个不同处理方法的组中。这种做法忽略了男性和女性的差异。一个更好的实验设计应该考虑男女区别对待。将所有的女运动员随机分配到3个组中,每组补充一种提高免疫能力的营养补剂。然后再将所有的男运动员随机分配到3个组中。图2-2概括了这个改进的设计方案。

图2-2中的实验设计利用了对照、随机和重复的原则。然而,它的随机性并不彻底(所有的受试者被随机地分配到各个处理组中)。它的这种随机性仅仅是局限在相似的受试者组成的组内进行操作。这些组被称为 ,这种实验设计被称为 批实验设计

分批实验设计

一批是指在某些方面相似的一组实验的单位或受试者,他们的这些相似之处被认为将影响他们对各种处理方法的反应。在一个 分批实验设计 中,实验个体向各个处理方法组的随机分配是在各批内分别完成的。

图2-2 比较3种提高免疫能力的营养补剂对男女运动员不同作用效果的一个分批实验设计。男女受试者分别组成2批

对各批的区分是另外一种形式的控制。他们是通过将一些暗藏的变量直接代入实验设计中而形成不同的批来控制这些变量对实验结果的影响(就如同例16中受试者的性别那样)。分批实验设计与抽样中的分层设计是相似的。分批和分层都是将相似的个体归为一组。对它们使用了不同的名称只是因为抽样和实验设计的思想是分别发展形成的。分批可以得出有关各批受试者相互独立的结论,例如,在例16中有关男女运动员免疫功能变化的结论。分批实验设计也可以得到更加精确的总体结论,这是因为在分批实验设计研究这3种提高运动员免疫能力的营养补剂的总体影响时,男女之间的系统差异可以被排除在外。

配对实验设计

配对实验设计是一种特殊的分批实验设计。配对实验设计对比了2种处理方法的作用效果。每一批只有2个个体组成,它们尽可能贴切地相互匹配。这些个体通过投掷硬币或者查阅附录1表1中的偶数和奇数数字而随机地分配到不同的处理方法组中。或者在一个配对实验设计中每一批只有一个受试者组成,该名受试者按照先后顺序一个接着另外一个地接受了两种处理方法。那么在这种情况下,每一个受试者都是他或她自己的对照。

例17 右手对左手。 右手作为优势手(右利手的)人的右手通常比其左手更加强壮吗?一名学生设计了一个实验来研究这个问题。她将一个普通的浴室中的体重秤固定在一个离地面有1.5米(m)高的架子上,同时使秤的一端伸出架子。受试者将大母手指放在秤底面,其他手指放在秤上面,然后用力挤压秤。这样秤的读数就测量出受试者手的力量是多少千克。

一项完全随机实验设计将需要2组受试者,每一组是右手或左手是优势手。显然,让每一位受试者使用两只手是更加自然的一种设计,这样可以直接获得一个左右手力量的比较。这就是一个配对实验设计。其名称就提示我们,我们不是在两个组之间进行比较,取而代之是在配对的两个观测之间进行对比,在这项研究中是同一个人的两只手。

那么在这项实验研究中的随机性又是怎样呢?该实验不能够将受试者随机地分配到不同的组中。相反,选择受试者哪一只手先检测是随机的过程。受试者在完成了第一次挤压秤的检测后,可能会赢得自信心或者学会了如何更好地挤压秤完成检测。将左右手参加检测顺序随机化可以防止这种学习效果对左右手力量差异的混淆作用。

练习4

2.26 假设对医生健康研究中,你有20名受试者将要分配到各个处理组中(图2-1)。为了方便暂且将这20名受试者称为A、B、C、…、T。利用附录1表1从第128行开始完成这个随机化过程。

2.27 钙与血压。你正在参与一项医学实验的设计,这项实验是为了研究在饮食中增加钙的摄入量是否能够降低中年男性的血压。初步的研究工作表明,补充钙可能是有效的,并且这个效果对于黑人男性可能比对白人男性更明显。

(a)概括一个合理的实验设计。

(b)用简单的语言解释使用较大的受试者群体的好处。

2.28 你怀疑一种药物会影响受试者的协调。这种药物可以通过3种方式服用:口服、通过皮下注射和通过静脉注射。这种药物的作用效果可能依赖于服用的方法和服用的剂量。所以,你希望研究两个解释变量的作用效果:剂量(在2个水平上)和服用方式(通过上述的3种方法)。应变量是这些受试者在一个标准的协调性测验中的得分。受试者有90人。

(a)列出通过这两个解释变量可以形成的作用方式种类。

(b)描述一个合适的完全随机设计。(只概括这个设计,不必解释如何随机化。)

(c)你可以通过实施一项针对同一个服用方法比较两个剂量作用效果的实验来研究剂量的作用效果,也可以通过针对同一个剂量比较三种服用方法来分别研究服用方法的作用效果。你在(a)中设计的实验相对这两个实验的优点是什么?

2.29 20名体重超重的女性同意参加一项有关4种减肥方法效果的研究。分别将这4种减肥方法称为A、B、C和D。研究人员首先将受试者的实际体重与她的“理想”体重进行对比,计算出每一位受试者肥胖的程度。受试者姓名和她们多余的体重kg数如下:

应变量是在8周治疗后体重下降数量。因为一位受试者过多的体重数量将影响这个应答结果,所以我们将使用分批设计。

(a)将受试者按照多余体重逐渐增加的顺序排列。通过将体重超重最少的4个分为一组,然后是下面的4个等等,最终形成每组有4位受试者组成的5个批次。

(b)利用附录1表1随机地将每一批中的这4个受试者分配到4种减肥方法中。请务必解释清楚你是如何利用这个表的。这个分批设计尽可能贴切地将这4组人群对应这项研究开始时体重多余的数量。

2.30 一位营养学家拥有两个遗传品系中每一个品系的大鼠10只。我们可以通过将各个遗传品系作为不同的批来区别对待,并随机地将每一种遗传品系的5只大鼠分配到饮食A中。每一种遗传品系中剩余的那5只大鼠吃饮食B。简要地写出这个实验设计。然后使用附录1表1从第111行开始进行随机化过程。 DWGWt1VVQ+NLpdkPZQ3rLLcB/Zdaay3U/jhEaehvJHFKYrp5ffHUWTKKlbVpcplF



5 公共政策实验研究

对于一种新的运动损伤治疗方法或者一种新药的作用效果通常是通过随机对照实验研究来进行检测的,这样做也是有充分理由的。一项设计完美的实验研究相对任何一种其他的研究方法能够提供更加准确的答案。那么用实验研究的方法来检测一项新的健身项目、一个新的健康保险系统或者是一项新的学前教育项目的效果又如何呢?有关这些领域中的一些公共政策的决议通常是基于许多假设,而几乎没有多少相关的知识。当然,在这种情况下,通过一个实验研究获得明确的答案也是值得尝试的。

近年来,许多按照统计学规律设计的实验研究被用来检测公共政策的变化。其中的一些实验研究结果为支持居民的健身娱乐系统的变革提供了支持。从总体上来看,下面的这个例子更好地演示了组织实施公共政策实验研究的困难有多大,而不是显示了它们的影响力更强。

例18 运动人体科学专业学生培养模式与就业。 目前,全国多数体育院校都开设了运动人体科学专业,并有一定招生规模,但是在运动人体科学专业学生培养模式与他们的就业上似乎存在一些问题。多数院校培养的运动人体科学专业学生最终获得的是教育学学士学位,而他们就业所从事的工作却在很大程度上与医学有关,这样就形成了运动人体科学专业学生培养模式与就业之间的矛盾。可以设计一个实验研究来阐明这个矛盾的存在。从某所体育院校中抽取500名运动人体科学专业的学生,将这500名学生随机分配到2个班中,即E班和M班,每班都是250名学生。其中E班按照目前多数体育院校的培养模式,最终获得教育学学士学位;而M班按照医学院校的培养模式,最终获得医学学士学位。然后,在毕业时分别记录两个班学生在本专业领域内的就业率,并进行比较。

在这项研究中,研究的个体是某所体育院校中满足条件的学生中随机抽取的500名学生。这项实验研究的解释变量是学生培养模式,应变量是学生毕业时在本专业领域内的就业率。显然,这项有关学生培养模式对其就业状况影响的实验研究面临着大量的现实困难。首先,将学生随机地分配到不同教育培养模式的E班或者M班就忽视了学生自己的选择,没有尊重学生选择受教育的权利,在现实生活中行不通。其次,本实验研究涉及到两种不同教育培养模式,其课程设置、教师配备、学生自己的兴趣、社会对人才的需求等等因素都将在很大程度上影响实验研究的结果。再次,本实验研究的结果要等待至少4年的时间才能够得到,在这4年中社会对于各种人才的需求可能又会发生一定的变化。最后,有关各个专业学生的教育培养模式是由教育部等政府部门决定的事情,一所大学没有确定或者改变某个专业学生教育培养模式的权力。

政策实验研究的不利之处

公共政策实验研究常常会面对一些严重的 现实困难 ,这些困难将阻碍好的实验的实施。

实验研究往往花费非常 昂贵 ,并且需要一个很长的时间才能够完成。

实验的结果对于一些公共政策的重大问题几乎没有影响,这些问题都被政治所操控。

并不是所有的政策实验研究的结果都是一无所获。下面的一个例子中实验研究确实有助于人们健身意识的改变,改善居民身体健康状况。

19 全民健身器械对居民健身运动时间影响的实验研究。 随着中国经济的迅速发展,中国居民不仅解决了温饱问题,而且正朝着小康水平奋进。饮食结构的改变是生活水平提高的一个重要表现,结果居民饮食中肉、蛋、奶的摄入量大量增加,导致部分人群摄入油脂和食糖过多,引发心脑血管疾病、高血压、高血脂和糖尿病等一些慢性疾病,发病率显著增加,通过诱导居民积极参加体育运动,增加热量消耗是解决居民健康问题,预防中老年慢性疾病的重要措施之一。这项实验研究了在居民住宅附近以及其他一些公共场所(例如公园、马路两侧、晨练场所等。)增设健身器械对居民健身运动时间的影响。这项新政策的支持者们认为,由于在居民住宅附近以及其他一些公共场所增设健身器械,而且是免费使用,对于居民来说是既方便又经济,因此可以诱导居民健身运动时间的明显增加,对提高居民的身体健康状况,增强老百姓的体质,预防和缓解许多慢性疾病的发生有积极的意义。其反对者认为,这项新的计划会增加政府的财政负担。

这项实验研究的个体是在北京市全民健身器械安放试点区域随机抽取的居民。这个实验研究初期的随机抽样有助于确保在这项实验研究中被抽取的居民是一些典型的市区居民。最终,有51 357名居民参加了本项实验研究。

在这项实验研究中,解释变量是北京市这些试点区域内全民健身器械的安放,主要是在居民住宅区附近、公园、马路两侧、晨练场所等一些居民经常去的公共场所。相应的应答变量是这些区域内居民参加健身运动时间的长短。参加这项实验研究的这51 357名居民,根据性别和年龄被分为4批,每批大约有10 000名居民组成。因为不同性别和年龄阶段的居民参与健身运动的情况存在差异,所以本研究采用了分批实验设计方案。

上述的北京市全民健身器械对居民健身运动时间影响的实验研究得到了广大市民的理解和支持。但是,在研究人员实施研究过程中也遇到了一些现实的困难,例如遭到居民的拒绝,受试者中途退出等等。在最初抽样的50 000名居民中,有35名拒绝参加,213名中途退出。后来又增补了1 605名居民。最终是有51 357名居民参加了本项研究。

这项研究的结果促进了北京市全民健身器械在全市的增设,并最终扩展到全国的各个省市,为我国全面推广全民健身计划提供了可靠的实验研究支持。同时,政府也采纳了合理化的建议,通过发行体育彩票的形式募集了所需要的资金,所以这项政策的出台并没有给国家的财政带来负担。

政策实验研究的有利之处

一项随机对照实验能够提供明确的证据,表明政策上的变化确实导致了结果的变化。

社会福利性质的事业是一个规模宏大、昂贵而复杂的问题。在社会福利政策方面,人们提议了许多相互矛盾的变化,在如此广阔的一个范围内,人们很难决定通过一个实验研究应该具体比较什么样的建议。当公共政策所涉及的问题更小,并且所要对比的处理方法更加明确清楚时,针对公共政策的实验研究才更容易取得成功。例如,实验研究已经帮助健身器械在城市公共场所的设置。

公共政策的决议将影响所有的人,包括直接地或者间接地改变社会和税款的使用。大多数的政策辩论是围绕着许多词语和一些数据资料展开的,这些数据资料可能是相互关联,也可能相互之间没有联系。实验研究将允诺,有时是直接给出有关所提议新政策作用效果的特定问题的特定答案。

练习5

2.31 加拿大要求所有的汽车必须配备“汽车白天行驶灯”,它是一个在汽车发动时自动开启的在一个较低水平的前照灯。一些汽车生产厂商现在也开始为在美国销售的汽车配备行驶灯。汽车行驶灯是否通过使汽车更容易被发现而降低了事故的发生呢?

(a)简要地讨论一个实验设计来帮助回答这个问题。你将检测的应变量是什么?

(b)在例14中讨论了中央刹车灯。你在那个例子中得出了什么结论可以应用于检测汽车行驶灯的效果的实验中?

2.32 一旦一个人被证明了醉酒驾车而触犯了法律,法庭所命令的处理或惩罚措施的一个目的是为了防止将来同样犯罪案件的发生。请提出法庭可能要求的3种不同的惩罚措施。然后,概括一个比较这三种措施惩罚效果的实验研究设计。请一定要指定将测量的应变量。

2.33 警察通常对家庭暴力案例的应对措施是缓和现场气氛,并对冒犯他人者进行警告,但是并不逮捕他,除非他使用了武器或者其他要求逮捕的环境中。有关警察对家庭暴力应对措施方面的第一个实验提示,逮捕冒犯他人者减少了将来类似事件的发生。这个证据再加上来自妇女群体的压力已经改变了许多城市中警察的有关政策,现在这些城市中被指控有家庭暴力的人将被逮捕。

概括一个实验的设计,这个实验将对比“警告并释放”与“逮捕并拘押”的效果。这个实验中的应变量是什么?你将如何帮助警察在现场完成所要求的随机化?

2.34 1995年,美国消除了全国高速公路55英里/小时(MPH)的速度限制,引发了有关降低高速公路速度限制是否能够减少交通死亡率的大量争论。

(a)现在各个州都设定了自己的速度限制。我们是否能够通过对比那些较低高速公路速度限制的州(比如马萨诸塞州)与较高速度限制的州(像蒙大纳州)的交通死亡人数来回答这个问题呢?对你的回答进行解释。

(b)设定较低的速度限制的支持者们指出,在20世纪70年代美国全国的高速公路速度限制降低到55MPH后,交通死亡人数减少了。这个结果有说服力吗?解释你的回答。

(c)你将如何设计一个实验来比较速度限制分别是55MPH、65MPH和75MPH的交通安全情况?除了概括出一个统计学上的设计之外,还要描述这个实验的具体实施。你将使用什么样的道路?在同一个道路上,随着时间的推移你将改变速度限制吗?或者在相似的路上同一个时间指定不同的速度限制吗?

2.35 选择一个有关公共政策的问题,你感觉通过一项实验研究你可能将它澄清。简要地讨论你所建议的这项实验研究的统计学设计。什么是干预措施?什么是应变量?是否用到分批设计? DWGWt1VVQ+NLpdkPZQ3rLLcB/Zdaay3U/jhEaehvJHFKYrp5ffHUWTKKlbVpcplF

点击中间区域
呼出菜单
上一章
目录
下一章
×