观察与实验
一项 观察研究 是观察个体,并对自己感兴趣的变量进行测量,但是不会去试图影响个体的各种反应。样本调查是一类非常重要的观察研究。一项观察研究的目的是为了描述一些群体或其所处的状态。
一项 实验研究 是有意识地对受试者个体施加一些治疗或者处理方法,以便观察他们的反应。实验研究的目的就是研究这些治疗或者处理方法是否导致了受试者反应的变化。
例1 阿司匹林与心脏病 。规律地补充阿司匹林可以减少患心脏病的机率吗?一项针对医生身体健康的医学实验研究的结果将有助于对这个问题的回答。在一个有22 000名男医生构成的群体中随机选择11 000人,要求每人每隔一天吃一片阿司匹林。另外11 000名人要求吃一种安慰剂,它是一种外观与口味与阿司匹林相似的但是不含活性成分的药片。几年之后,安慰剂组的医生中有239人患心脏病,但是阿司匹林组的医生中仅有139人患心脏病。这个差异足以证明阿司匹林可以降低心脏病的发生。
例2 运动训练是否能够改变运动员骨骼肌快慢肌纤维的百分含量呢 ?研究人员获得了中国山东省田径队所有径赛项目运动员的名单。然后,研究人员检测并对比了所有运动员骨骼肌快慢肌纤维的百分含量。结果发现,短跑项目运动员骨骼肌快肌纤维百分含量比长跑项目运动员快肌纤维百分含量高出许多。而长跑项目运动员骨骼肌慢肌纤维百分含量比短跑项目运动员骨骼肌慢肌纤维百分含量高出许多。
从表面上看,短跑项目运动员主要进行短时间骨骼肌爆发力和速度训练,检测结果是骨骼肌快肌纤维含量高,这种爆发力和速度训练似乎导致了快肌纤维含量高;长跑项目运动员主要进行长时间骨骼肌持续收缩的耐力训练,检测结果是慢肌纤维含量高,这种耐力训练似乎导致了运动员慢肌纤维含量高。但这项观察研究没有给出证据表明运动训练能够改变运动员骨骼肌快慢肌纤维的百分含量。应该说,在这项观察研究中,是运动员自己决定是选择短跑项目还是长跑项目。即使是教练员替运动员选择了专项,通过运动训练和竞争淘汰,最终表现为短跑项目运动员的快肌纤维含量高或者长跑项目运动员的慢肌纤维含量高,这可能并不完全是速度训练或者耐力训练所导致的,有可能是短跑项目运动员的快肌纤维百分含量先天遗传得高,长跑项目运动员的慢肌纤维百分含量先天遗传得高。因此,不能够说是运动训练导致了这样一个差异。
例1和例2形象地演示了实验研究相对观察研究所具有的巨大优势。从原则上讲,实验研究能够给出支持因果关系的证据。在上述的医生身体健康实验研究中,所有的医生都是每隔一天吃一片药,并且都有相同的体检方案和信息。他们之间唯一的区别就是药的成分不同。因此,当其中一组医生患心脏疾病的人相对少许多时,我们就可以得出结论是药的成分不同导致了这个差异的出现。相反,研究人员对短跑项目和长跑项目运动员骨骼肌快慢肌纤维百分含量的检测与对比,在描述短跑项目和长跑项目运动员骨骼肌快慢肌纤维百分含量之间的差异上是很好的。但是研究人员却没有办法讨论其中的因果关系。
如果研究人员能够在短跑项目运动员进行速度训练前或者长跑项目运动员进行耐力训练前分别检测运动员骨骼肌快慢肌纤维百分含量,然后在这些运动员经过一个阶段的速度训练或者耐力训练后再次检测骨骼肌快慢肌纤维百分含量,并将此检测结果与运动员运动训练前的数据相互对比,就可以得出有关运动训练是否可以改变骨骼肌快慢肌纤维百分含量的结果。事实上,研究人员也是这样做的。肌纤维分类的实质是依据肌肉的各种内在和外在特征对肌纤维的性质进行判别的过程,同时也是人们全面认识肌肉功能及其适应变化的一个重要方面。目前,根据肌肉收缩性质、肌纤维代谢性质、肌球蛋白ATPase(ATP酶)活性及其分子结构特点将肌纤维划分为慢收缩强氧化型(SO)(I型)、快收缩强氧化酵解型(FOG)(IIb型)和快收缩强酵解型(FG)(IIa型)。另外,根据肌球蛋白分子重链(MHC)的电泳迁移率不同,将MHC划分为Ⅰ型和Ⅱa、Ⅱb、Ⅱx型的分类法也已成为研究人员关注的方法。典型的耐力性项目和速度性项目运动员肌纤维类型分布的百分比差异是运动训练的结果,还是“自然选择”的结果,对此学术界有两种截然不同的观点。一种观点认为每个人的肌纤维类型自出生以后便是固定不变的,此乃“遗传决定论”的基本观点。支持该观点的实验证据有很多,最典型的是Komi等的研究。他们通过对单卵双胞胎股外肌样本的活体检查,发现Ⅰ型百分含量的遗传度高达96.5%。而另外一种观点认为,肌纤维类型百分比是可以通过训练改变的。支持这种观点的研究主要包括:Jansson等发现无氧性训练后被试Ⅰ型百分含量减少,而Ⅱ型百分含量增加,并提出Ⅱc纤维是Ⅰ型纤维和Ⅱb型纤维相互转化的过度纤维。Simoneam等发现,经大强度间歇训练后,被试Ⅰ型百分含量由训练前的41%增加至训练后的47%,而Ⅱb型纤维由17%减少至11%。Howald等让受试者以70%VO 2 max强度进行6周的耐力训练,结果发现Ⅰ型百分含量增加12%,Ⅱb型百分含量减少了24%。近几年来,对肌纤维类型转变的研究基本上都集中在肌球蛋白分子本身,在分子水平上将肌肉的结构与功能统一起来。在这些研究中,运动训练不仅被证明可以改造肌纤维的组织化学类型,而且还可在更深的层次上,即在MHC分子水平上改变其构造。
当两个变量之间存在密切的相互关系时,就会出现有关“统计证据”的争议,但是在实验研究中不会发生这种情况。
下面详细地讨论实验研究过程中所用的词语。
实验研究的词语
研究单位 ——实验研究的对象。当研究单位是人类时被称为受试者。
变量 ——一个研究单位的一个被测量的特性。
应变量 ——一个变量,研究其变化情况并得出结果。
解释变量 ——一个用来解释或者导致应变量变化的变量。
干预手段 ——应用于研究单位的任何一种特殊的实验情况。如果一项实验研究有几个解释变量,那么一种干预手段就是这些变量的一些特殊数值的一个组合。
例1中,受试者是22 000名医生,解释变量是受试者吃了阿司匹林还是吃了安慰剂,而应变量是受试者是否患心脏病。例2中,尽管它不是一项实验研究,但是它也有一个解释变量(运动员的速度训练或者耐力训练)和一个应变量(骨骼肌快慢肌纤维百分含量)。使一项研究成为实验研究的关键并不只是看其是否具有解释变量和应变量,而是看下面的一个例子是一个有2个解释变量的实验研究。
例3 医生健康研究。 事实上,在医生健康研究中观察了两种药物的功效:阿司匹林和β-胡萝卜素。人体可以将β-胡萝卜素转化为维生素A,而维生素A在人体内有助于预防一些种类的癌症发生。图2-1所示是这两个解释变量是如何相互结合而形成4种治疗方案的。在研究进行过程中的奇数天,受试者服用一片含有阿司匹林或者安慰剂的白色药片。在双数天他们服用一种含有β-胡萝卜素或者是安慰剂的红色胶囊。同时还有几个应变量,即这项研究观察了心脏病发作,几种癌症以及其他一些医学结果。
本研究的结果可能会获得同时补充阿司匹林和β-胡萝卜素的功效(无论是好的还是坏的),但是对于这个结果是不能够通过单独服用阿司匹林或单独服用β-胡萝卜素的研究进行预测的。这种结合的功效被称为两个解释变量间的 交互作用 。在医生健康研究中,一些医生单独服用了阿司匹林,一些单独服用了β-胡萝卜素,一些服用了两种药物,而一些没有服用任何一种药物。通过对上述这4组治疗效果的对比,本研究不仅可以寻找服用阿司匹林的功效和服用β-胡萝卜素的功效,而且还可以寻找它们交互作用的效果。
图2-1 在医师健康研究中的治疗方案。每一个受试者要接受这四种药物组合方式的一种
进行实验研究的目的是什么?通过实验,可以研究某个具体的治疗方案的功效。几乎没有人会选择自己去同时服用阿司匹林和β-胡萝卜素,但是一项实验研究可以要求他们这样做。是可以通过实验研究几个解释变量间的交互作用。最重要的是,实验研究是获得支持因果相关关系的良好证据。
研究人员有关运动训练是否能够改变骨骼肌快慢肌纤维百分含量的研究失败了(例2),这是因为在他们的研究中,无法区分运动训练的真实作用效果和先天遗传的效果。设计糟糕的实验研究具有相似的弱点。
例4 电刺激对举重运动员股四头肌力量的影响。 人体的神经和骨骼肌组织是可兴奋组织,这种“兴奋性”的实质是跨过组织细胞膜的一种电变化,即生物电。人们很自然地会想到,适度电刺激可能会影响骨骼肌的力量。研究人员组织了一项实验来研究电刺激对举重运动员股四头肌力量的影响。研究人员在实验研究开始时检测了运动员股四头肌力量,在这些运动员的股四头肌接受电刺激的2个月后,研究人员再次测量运动员股四头肌的力量以查看是否发生了改变。
在这项研究进行的过程中,举重运动员的力量训练始终未停。这些运动员在第一次测验和再次测验之间股四头肌的力量确实发生了改变,但是无法知道运动员股四头肌力量的这个改变中有多少是由于解释变量(电刺激),有多少是出自力量训练。所以,这个数据资料并没有给出电刺激对肌肉力量作用效果的任何信息。
在例2和例4中,解释变量对应变量的作用效果与暗藏的一些影响混在一起。
混杂设计
一个 暗藏的变量 对一个研究中的各个变量间的相互关系发挥着重要作用,但是它本身又没有包括在研究的变量之中。
当两个变量对同一个应变量的作用效果不能被区分时,这两个变量就发生相互混杂。相互混杂的变量可能是解释变量,也可能是暗藏变量。
在实验室中进行的科学研究实验通常是一种简单的设计:实施治疗方法并观察结果。我们可以将这个设计概括如下:
在实验室中,应通过严格地控制实验环境来消除除了实验治疗方法外任何其他因素对应变量的影响,避免混杂因素的出现。然而,一旦离开了实验室,几乎总是有一些暗藏的变量在混杂实验的效果。当实验的对象是人或者动物而不是电子或者化学物质时,即使是在一个实验室或者医疗诊所的严格控制的环境中,这种混杂现象也会发生。
例5 胃冷却。 “胃冷却”是针对胃溃疡患者的一个有效的治疗方法。病人吞咽一个放了气的气囊,气囊上连接着导管,然后通过导管向气囊内灌注冷冻的溶液并持续1小时。这个方法的思路是冷却胃内环境将降低其胃酸释放数量进而缓解溃疡的发生。《美国医学学会杂志》中的一项实验研究报告表明,胃冷却确实缓解了溃疡的疼痛。其设计是:
这种治疗方法安全可靠并且简便易行,所以被广泛使用了很多年。
然而,病人对于胃冷却的应答与安慰剂的效应混杂在一起。安慰剂是一种对身体没有任何效应的虚假治疗。许多病人的反应是任何一种治疗都有效,即使是安慰剂,这可能是由于病人对医生的信任和对治愈的期望。
几年后进行的第二项研究,将胃溃疡病人分为2组。其中一组病人如同以前那样接受胃冷却治疗。另外一组接受安慰剂治疗方法,其灌注进入气囊的液体不是冷冻的而是人体体温水平。其结果是:在治疗组的82名病人中,有34%的人病情好转,但是在安慰治疗组的78名病人中,也同样有38%的人病情好转。这个实验研究以及其他一些严格设计的实验研究表明,胃冷却的治疗效果并不比安慰剂的效果更好,所以它的使用就被终止了。
观察研究和简单的实验研究常常产生一些无用的数据资料,这是因为一些暗藏变量的混杂作用所致。当只能进行观察时,很难避免混杂作用的出现。实验研究提供了更好的可能性,例如无论是医生健康研究还是第二个胃冷却实验研究都包括了一个只接受安慰剂治疗的组。这样的实验设计就证明了胃冷却治疗方法是否比安慰剂好,并具有安慰剂效应之外的治疗效果存在。
2.1 运动的效果。一些人认为运动可以将人体升高的代谢速率持续长达12~24小时,从而使我们能够在运动结束后持续地燃烧脂肪。一位研究这个效应的运动生理学家要求他的受试者在一个跑台上持续地走几个小时。然后,他分别在运动前、运动后即刻和运动后12小时测量受试者的代谢率。这是一个实验吗?并解释原因。并分别解释变量和应变量。
2.2 测验乳腺癌。在早期被发现的乳腺癌的优选治疗方法中,乳房切除术(将乳房摘除)曾经是最常用的治疗方法。现在通常使用摘除肿瘤及其周围的淋巴结,再进行化疗的方法。为了研究这些治疗方法在治疗效果上是否存在差异,一个医疗小组检查了25所大医院的记录报告,并将所有接受过这两种治疗方法中任何一种的女性在手术后生活的时间进行了比较。
(a)解释变量和应变量分别是什么?
(b)解释为什么这不是一个实验。
(c)你认为这项研究将表明乳房切除术是否可以导致更长的平均存活时间吗?请对你的回答进行解释。
2.3 一位运动人体科学研究人员想比较两种铁制剂(A和B)在改善运动员缺铁性贫血方面效果的好坏。她首先对60名发生缺铁性贫血的运动员的Hb (血红蛋白)水平进行检测,然后随机将他们分为每组30名运动员的两个组。其中一个组每天补充铁制剂A,而另外一个组每天补充铁制剂B,两组运动员饮食状况相同。2个星期后,她再次对这些运动员进行检测,并比较这两组运动员Hb的平均增长情况。
(a)解释为什么这是一个实验。
(b)其中的解释变量和应变量分别是什么?
2.4 更好的蛋白粉?改良配方的蛋白粉无论是蛋白质含量还是必需氨基酸含量与比例,都可能比传统的蛋白粉有更高的营养价值。一项实验研究对比了改良配方蛋白粉与传统配方蛋白粉在增加骨骼肌方面的功效,这两个配方的蛋白粉分别被称为改良配方和传统配方。研究人员将体重在90.00千克(kg)以上级别、70.01kg~75.00kg级别和60.00kg及以下级别的健美运动员分别随机分为2组,其中一组运动员补充改良配方蛋白粉,而另外一组运动员补充传统配方蛋白粉,每一个体重级别的两组运动员的训练和饮食都是相同的。记录各组健美运动员训练21天后的体重增加。这些健美运动员的体重增加就是对两种蛋白粉营养价值的一种度量。
(a)这项实验的个体是什么?应变量是什么?
(b)有多少个解释变量?有多少种处理方法?利用一个像图2-1那样的简图描述这些处理方法。
(c)这项实验要求有多少个实验个体?
2.5 对手射击成绩的影响。一项有关射击运动员的对手获得的成绩对射击运动员心理稳定性和其他变量影响的研究按照如下的程序进行。研究小组将参加备战奥运会集训的射击运动员分为2组(A组和B组),2组运动员都按照国际射击比赛的规则进行比赛,其中A组中每一位运动员在每一个靶位射击后都会被告知对手同靶位的成绩;而B组中每一位运动员在每一个靶位射击后不会被告知对手同靶位的成绩。分别检测A组和B组运动员在各个靶位上的心理稳定性和注意力的变化。
(a)这是一项实验吗?为什么是或者为什么不是?
(b)解释变量和应变量分别是什么?
(c)这项研究是否含有可能影响射击运动员比赛中心理稳定性的真实结果的混淆因素?请解释。
2.6 麻醉剂的安全性。使用不同麻醉剂进行手术的病人的死亡率是不同的。一项观察性研究发现了下面这4种麻醉剂的死亡率:
这并不是表明环丙烷比其他的麻醉剂更加危险的好证据。请说明一些可能会混淆手术中选择不同麻醉剂的隐藏变量,它们可能解释了在死亡率上的不同。
2.7 哺乳婴儿。在一个有关女性的杂志中有一篇文章报道,那些哺乳的女性相对使用奶瓶喂养孩子的妈妈会对她们的婴儿感到更加温暖和容易接受。因此,这篇文章的作者得出结论,哺乳表明妈妈对孩子的态度具有合乎需要的影响作用。解释为什么这个事实使得有关因果关系的任何结论都是不可信的。在你的解释中使用隐藏变量和混淆的词语。
2.8 2007年,在一个成年男性人群感冒发生率的调查中,只有10%的人在这个冬季的一段时间内没有患一次感冒。2008年,这个人群中所有的男性每天都吃1g维生素C,结果20%的人没有患感冒。描述一些可能会与吃维生素C相互混淆的隐藏变量。
2.9 安慰剂效应。一项对内科医生的调查发现,一些医生给一名病人开出了一种安慰剂来缓解疼痛,这位医生也找不出疼痛原因。如果这位病人的疼痛状况改善了,这些医生就得出结论这个疼痛是没有身体基础的。组织实施这项调查研究的医学院的研究人员声称,这些医生们不懂得安慰剂效应。为什么?