心理学家和其他学科的科学家一样,使用科学方法来实证性地检验他们的观点。
是什么使得心理学区别于对人类行为的“常识”解释,或其他用于理解人类的伪心理学呢?只有心理学经得起 科学方法 (scientific method)的检验,科学方法通过观察来检验观点的正确性。相反,伪心理学建立在希望、证实性偏差、奇闻轶事和人类的轻信上。
你可能会认为这是心理学家傲慢的观点。为什么我们容不下其他理解人类的不同方法呢?事实上,我们容得下。心理学家很乐意与社会学家、人类学家、精神病学家以及其他科学家成为理解人类这一事业上的同伴。我们只是反对那些声称拥有“证据”,实际上只有轶事或口头证词的误导人的方法。
那么,让心理学成为真正的科学的,是方法。正如我们的核心概念所言:
心理学家和其他学科的科学家一样,使用科学方法来实证性地检验他们的观点。
这个神奇的方法究竟是什么?简而言之,科学方法就是对观点进行客观的正误检验的方法。这种检验的本质特征是 实证研究 (empirical investigation),即在直接经验(而不仅仅是观点)的基础上通过严谨实测收集客观信息。心理科学旨在通过实证研究寻求对行为和心理过程的全面解释。在科学领域,我们把这些解释称为理论,这是一个通常被误解的词。
“这只是一个理论。”人们可能会说。但对于科学家而言, 理论 (theory)具有特殊含义。简而言之,科学 理论 是对一系列广泛事实或观察结果做出的可检验的解释(Allen,1995;Kukla,1989)。显而易见,这个定义与人们惯常使用这个名词的方式不同。在日常用语中,理论可以意为胡思乱想或者仅是一种预感,即没有证据支持的想法。但对科学家来说,一个好的理论往往具备两个吸引人的属性:(a)解释事实的能力;(b)经得起检验的能力。得到充分支持的理论包括爱因斯坦的相对论、疾病的微生物理论和达尔文的自然选择学说。那么,检验一理论包括哪些基本步骤呢?
1.7 解读对一个想法进行科学检验所需的4个基本步骤。
1.8 分析实施心理学研究的5种方法。
1.9 描述心理学研究中的偏差和伦理问题。
解读对一个想法进行科学检验所需的4个基本步骤。
对任何想法进行科学检验都需要遵循4个基本步骤。我们可以将这4个步骤应用于探究糖使儿童亢奋的问题(见图1-5)。基本上所有的科学家都遵循相同的步骤,无论他们从事的是心理学、生物学、化学、天文学,还是其他任何科学研究工作。因此,让这些领域具有科学性的是 方法 ,而非它们的主题。
图1-5 科学方法的4个步骤
首先需要一个具体的可检验的想法或预测,它们也被称为 假设 (hypothesis)。这个术语的字面意思是“小理论”,因为它通常只代表一个更宏大的理论解释中的一部分。比如,某个假设预测内向的人容易被外向的人吸引,这个假设可能是整合所有浪漫吸引构成要素理论的一部分。假设还可能只是激发我们好奇心的一个有趣的观点,就像我们研究糖对儿童的影响一样。
为了可检验,假设必须具有潜在的可证伪性,也就是说,必须用一种可证明其正确或错误的方式来表述。让我们用下述假设来说明如何进行检验: 糖让孩子变得亢奋 。我们可以通过让孩子吃糖,然后观察他们的活跃水平来检验这一假设。如果我们发现孩子的活跃水平没有增加,那么这个假设就被证伪了。如果我们仅陈述一个价值判断,比如,糖对孩子“有害”,这条假设就无法被证伪。科学不以做出价值判断为目的,也无法回答不能进行实证检验的问题。表1-2列出了一些科学方法无法解答的问题。
表1-2 科学方法无法解答的问题
注:科学方法不适用于回答这些不能实施客观、实证检验的问题。
虽然科学有助于我们理解这些问题,但问题的答案最终要通过逻辑、信仰、立法、共识或其他科学方法以外的方式来寻找。
之后,科学家必须清晰地思考如何检验所提出的假设。他们需要用具体的术语定义研究的每个方面,这些术语被称为 操作性定义 (operational definitions)。以下就是我们这项研究的操作性定义。
那么,如果我们在研究中给一些孩子喝含糖饮料,给其他孩子喝含人造甜味剂的同种饮料,我们可以将“亢奋”操作性地定义为,含糖饮料组的平均活跃程度的评分显著更高。
掌握了假设和操作性定义,我们就已经向科学研究迈出第一步了。接下来,让我们来检验我们的假设。(像占星术或算命这样的伪科学的最大失败之处就在于,它们无法真正采取这一步骤来检验自身的主张。)
思考一个你想得到回答的心理学问题。
提出一个可证伪的假设。列出每个变量的操作性定义(比如,假设的元素)。
我们的实证研究从这里开始。从字面上看, 实证 意味着“基于经验的”——与完全基于希望、权威、信念或者“常识”的推测形成鲜明对比。然而,如果我们错误地将某个人的经验归类为“实证的”,那么这个术语的字面定义可能就是有误导性的。无论一个人的经验多有说服力,它仍然只是轶事或口头证词,需要在科学研究的受控条件下接受检验。正如我们在本章前面部分的“批判性思维”一节中所探讨的那样,假设一个人的经验也适用于其他人是危险的。
实证地 研究问题意味着仔细地、系统地收集证据,我们需要采用几种被证明可行的方法中的某一种,在下一节我们将深入探讨这些方法。设计这类方法是为了避免我们的预期、偏见和歧视所导致的错误结论。实证研究的优点在于我们可以更有信心地将获取的 数据 (data)应用或推广到更多人身上。
在收集完数据之后,我们会用一些数学或统计公式来分析数据。如果你讨厌数学,也不用担心:对统计过程的详细解释已经超出了本书的范畴——事实上,接受高等心理学教育的学生会修习关于统计方法的全部课程!然而,在我们的实验中,统计分析相对简单且直接,因为我们只想知道摄入含糖饮料的孩子的评分是否高于摄入无糖饮料的孩子。如果“是”,我们就可以宣布我们的假设得到了支持。如果“不是”,我们就否定这一假设。无论是哪种结果,我们都会获得一些知识。
科学方法的最后一步,是把完成的研究结果公布出来,接受科学界的审查和评论,你可以通过在专业期刊上发表论文、在专业会议上做报告,或者把研究内容写成一本书来完成这最后一步。之后研究人员需要等待评论者的回应。
如果同行认为这项研究有趣且很重要——尤其是当它挑战了其他研究或一个被广泛认可的理论——那么评论者可能会寻找你研究设计中的缺陷:主试是否恰当地选取了被试?统计分析是否正确?是否有其他因素也能导致这一结果?或者,他们可能会重复这项研究来对它进行检验。为了对实验进行 重复检验 (replicate),他们会自己重新做一遍,看看是否能得到相同结果。
事实上,我们所进行的糖对孩子影响的研究是马克·沃尔雷奇和他的同事们(Mark Wolraich et al.,1995)之前所做研究的简化复制。他们的研究持续了3周,比较了一组高糖饮食的孩子和另一组低糖饮食(含人造甜味剂)的孩子。与坊间流传的智慧相反,研究人员发现两组孩子在行为和认知(心理)功能上 没有差异 。因此,如果我们的研究发现了“高糖”效应,那么它就与沃尔雷奇的发现相矛盾,最后它会受到仔细的审查和批评。
论文在正式发表前还要进行专家评审,以毙掉那些在设计或实施上有缺陷的研究。期刊编辑和图书出版商(包括本书的出版商)通常会征求专业审稿人的意见。一般情况下,作者会收到有益的、即使有时是令人痛苦的修改建议。只有当一个假设扫清了这些障碍,编辑们才会予以出版付印,学者们才会将它暂定为科学的“真理”。
但我们要强调的是,科学发现永远是暂定的。只要它们还没被推翻,它们就永远要面对来自新研究的威胁,或是需要一个新的解释,或是把以前的研究成果送到学术垃圾里。因此,沃尔雷奇关于糖的研究结果最终也可能会被更好、更权威的知识所取代(尽管在本书撰写时还没被推翻)。显然,科学方法并不是一个完美的系统,但它却是迄今为止检验关于自然界的各种观点的最好方法。因此,它是人类最伟大的智力成果之一。
分析实施心理学研究的5种方法。
比起轶事或者伪科学,科学方法让观点有了更大的可信度。在科学方法中,研究人员可以通过几种具体的方法收集客观数据。每一种方法都有其独特的优点,也有其局限性。开展好的研究的一个关键步骤就是选择到最适合这些特定假设及资源的方法。
像 理论 这个词一样, 实验 (experiment)一词在科学领域中也有非常具体的含义。在日常用法中,实验可以指任何类型的正式或非正式检验;与之相反,在科学领域,该词仅指在严格控制的条件下收集信息的一套特定程序。由于实验是经过精心设计的,它是我们将在这里讨论的研究方法中唯一能够可靠地确定因果关系的方法。因此,如果一个假设的表述中出现了因果关系——就像我们提出的糖会导致孩子亢奋——那么实验就是最好的选择。让我们一起看看我们关于糖的研究是如何确定原因和结果的。
在最基本的实验设计中,研究人员只改变一个因素(被称为变量),并保持实验的所有其他条件恒定——对所有被试都一样。
科学家称这个变量为 自变量 (independent variable),因为它独立于研究中的其他变量。在我们关于糖的研究中,我们假设糖导致亢奋,所以糖/无糖是我们的自变量。通过让一些孩子摄入糖,让另一些孩子摄入糖的替代品,且保持所有其他条件不变,我们就是在操纵自变量了。因为实验中其他各个方面都保持恒定,所以我们可以说,自变量就是我们观察到的任何实验效应的原因。
因变量 (dependent variable)则是结果变量,或者说是我们假设的实验效应。换句话说,我们观察到的任何实验效应都取决于我们引入的自变量。在我们关于糖的实验中,因变量是孩子的活跃水平。如果我们后来观察到摄入糖的那组孩子更活跃,我们便可以确定是糖导致了亢奋,因为这是两组之间唯一的区别。
在进一步讨论之前,我们应该澄清用于区分被试的另外两个重要术语。
随机分配让各组均等
让孩子(或他们的父母)根据自己的喜好来决定分组,这是划分被试的一个简单方法。可问题是,允许孩子喝含糖饮料的父母和不允许孩子喝含糖饮料的父母之间可能会有一些差别。比如,允许孩子喝含糖饮料的父母在规则方面可能更宽松,这可能导致他们的孩子在玩耍时更吵闹——我们的实验结果会被混淆。类似地,我们也不能把所有女孩放在一组,而把所有男孩放在另一组。为什么不能?因为对糖的生理反应可能存在性别差异。此外,某一种性别可能比另一种性别更擅长控制自己的反应。这些事先存在的分歧可能会影响我们的实验结果。
最好的解决办法是 随机分配 (random assignment),将被试完全随机地分配到各组。一种方法是按字母顺序列出孩子们的名字,然后交替分配到实验组和控制组中去。通过随机分配,两组之间事先存在的差异达到了最小。这就确保了任何活跃水平的差异都可以归因于糖,而不是其他因素(比如,性别或父母教养方式)。
实验确定因果关系
实验方法是确定因果关系的黄金标准。它通过分离出研究人员感兴趣的变量(自变量),同时保持所有其他实验条件不变来确定因果关系。通过随机分配来最小化实验组和控制组先前存在的差异,因此我们可以更确信地将结果(因变量)的差异归因于自变量的影响,而非其他因素。
既然实验是找出因果关系的有力方法,我们为什么还需要其他方法呢?一方面,并不是所有的假设都旨在寻找因果关系——有些只是想描述特定的群体,比如,确定哪些性格特质在心理学系学生中是常见的。
另一方面,伦理方面的考虑也会阻止我们进行某些类型的实验研究,特别是那些可能对被试造成潜在伤害的实验研究。那么,在这种情况下,下列其中一种研究方法就是一个更好的或更实际的选择。
除了上述考虑因素之外,还有另一个因素影响着研究人员对方法的选择:出于现实或伦理上的考虑,有时科学家无法充分地控制情境,他们不能实施真正的实验。比如,你想测试这样一个假设,儿童摄入含铅油漆会增加其出现学习障碍的风险。(含铅油漆在老房子里很常见,特别是在城市低收入家庭的住房中。)但你不能开展实验,因为实验需要你操纵自变量——在这个例子里意味着把有毒物质(铅)暴露给一群孩子。显然,这一做法是有害的和不道德的。
幸运的是,你可以找到绕开这一问题的方法——但代价是放弃对一些研究条件的控制。解决方案是采取 相关研究 (correlational study)。在相关研究中,你实际上是在寻找一个在现实世界中已经偶然发生了的“自然实验”。因此,在关于含铅油漆的影响的相关研究中,你可以寻找一组已经接触过含铅油漆的儿童。然后,将他们与另一组没有接触过含铅油漆的儿童进行比较。作为进一步的控制,你应该试着将两组儿童进行匹配,使他们在每一个可以想到的方面(如年龄、家庭收入和性别)都保持一致——除了他们是否接触过含铅油漆。
相关研究的一大缺陷是,你永远无法确定每组之间是否完全具有可比性,因为你没有随机地将人们分配到 实验组 ,也没有操纵 自变量 。事实上,每个组都可能在一些重要的变量上存在差异(如获得的医疗保健或营养状况),而这些变量可能会被你忽略。因此,即使你发现接触含铅油漆的儿童中有更多的人存在学习障碍,你也不能肯定地得出结论:接触含铅油漆会导致儿童出现学习障碍。你最多只能说接触含铅油漆与学习障碍之间存在 相关性 。不过,这一结果依然有用,因为它缩小了对学习障碍的关联因素的搜索范围。此外,一系列可靠的相关性发现有时能为实验研究铺平道路。媒体报道的很多研究发现很可能来自相关研究,而不是实验研究,所以让我们近距离看看这些发现意味着什么,以及我们应如何准确地解读它们。
三种相关关系(见图1-6)
1. 如果两个变量呈现出向同一方向变化的模式(随着一个变量的增大,另一个变量也增大),我们称之为 正相关 。例如,在我们的假设中,我们预测了一种正相关关系,即接触含铅油漆的儿童有更高的学习障碍风险。
2. 但当一个变量减小,而另一个变量增大时,这叫作 负相关 。你可能会发现大学生的饮酒量与他们的平均绩点(GPA)之间存在负相关关系(随着大学生饮酒量的增加,他们的平均绩点下降)。
3. 最后,如果变量之间完全没有关系,这就是 零相关 。例如,身高和GPA之间就是这种关系。
研究人员通常将相关程度表示为一个数字,低至-1.0(表示强负相关),高至正数+1.0(表示强正相关)。重要的是,我们要注意,相关性即使是负的,也可以表示强烈的相关关系。(请注意,教授们经常会出关于这个知识点的考题!)假设我们发现焦虑和学习时间之间的相关性为-0.7。也就是说,这是一个负相关,表明更强的焦虑与更少的学习时间相关。尽管这是一个负相关,但显示了比美国高考(SAT)成绩与GPA之间+0.4的正相关 更强 的关系。
图1-6 三种类型的相关关系
注:图1-6展示了三种主要的相关类型,包括27个人的数据点。(A)SAT成绩与GPA呈正相关;(B)每周饮酒量与GPA呈负相关;(C)身高与GPA没有相关性。
思考两个你认为在你的生活中相关的变量。描述你认为它们是怎样相关的,并说出你预测的相关性是正相关还是负相关。
解释相关性发现
批判性思维中最常见的错误之一是,将相关性发现曲解为因果性发现。例如,几年前,研究发现儿童的自尊与他们的学业表现之间存在正相关关系。这是否意味着高自尊会使孩子们在学校表现得更好?这可不一定——得出上述结论就是因为犯了批判性思维的错误!虽然这一观念与我们关于自尊益处的“常识”相符,但如果我们没有进行实验研究、没有操纵自变量(自尊)、没有把学生随机分配到实验组和控制组,我们就不能确定它们的因果关系。科学家们通常这样描述这条一般原理: 相关关系不一定意味着因果关系。
所以,为了避免这个重要的批判性思维错误,对于任何相关性发现,你一定要想到如下三种可能的解释(见图1-7)。
图1-7 解释相关性结果的三种方式
注:(1)变量A(自尊)与变量B(学习成绩)呈正相关(相关)。自尊水平越高的学生学习成绩也越好。
(2)这一相关性的一个可能的解释是A导致B——在这种情况下,高自尊帮助学生在学校取得更好的成绩。
(3)这一相关性的第二个可能的解释是B导致A——在这种情况下,在学校取得更好的成绩会提高学生的自尊水平。
(4)第三种可能的解释是,第三个变量(我们称之为C变量)——在研究中未被测量的变量——可能是A和B之间的关系的真正原因。在这种情况下,自控力是一个可能的C变量。换句话说,自控力可能既会帮助孩子提高学习成绩,也会提高孩子的自尊水平。
因此,在相关性研究中必须将这三种解释考虑齐全,因为在没有实验研究的情况下是无法确定因果关系的。
重要的是要记住,假若我们没有真正实施一个实验,对原因的猜测就仅仅只是猜测——而且具有潜在的危害。我们在此探讨的例子有力地说明了这种危害:在相关研究展现了自尊与成绩之间的关系后,人们错误地认为高自尊能提高学生的成绩,美国向提高学生自尊的教师培训项目投入了数百万美元。起作用了吗?没有。相反,后续的实验研究却发现,成绩好是高自尊的原因之一,这一结果为前文中B导致A的解释提供了支持。而且,事实证明,自控力(在本案例中,是变量C的一个例子)既能提高自尊,也能提高学习成绩(Baumeister et al.,2003)。即使是训练有素的研究人员和立法者,在被“常识”干扰时,他们对研究的解释也会犯错误。
思考以下场景:一篇新闻报道写道,睡眠时间越长的人越有创造力。
用学到的三种方法解释这一相关性的发现,写出解释这一发现的所有方式(用A、B、C的格式)。
学生更喜欢哪种学习方式:听讲、自行阅读材料,还是参与亲自动手的实践活动?如果你想知道这个问题的答案,你不需要做实验或开展相关研究。你可以简单地通过 问卷调查 (survey)来询问学生们喜欢什么,问卷调查是确定人们的态度、偏好或其他特征的一种受欢迎且有效的方法。
问卷调查的方法被民意调查专家和营销顾问(以及许多心理学和社会学的研究人员)广泛使用,他们通常会让人们回答一组事先准备好的问题。问卷调查法的最大优点在于能够相对快速和廉价地收集大量被调查者的数据,例如,进行网上问卷调查。不过这种容易获得很多人数据的方式,也成了问卷调查的最大缺点:它容易受到各种偏见的影响。
在开展一项问卷调查或解释其结果时,有哪些常见的偏见呢?社会期望偏差 是指被调查者以符合社会期望或政治正确的方式回答问题的倾向(Schwarz,1999)。其他偏差(见表1-3)可能来自如下三个方面。
避免这些偏差后,问卷调查将会非常有用——但这也只适用于可以通过调查对假设进行合理研究的情况。例如,通过询问家长是否注意到他们的孩子在吃糖后变亢奋,来研究糖对孩子活跃程度的影响,这一方法可以揭示家长对糖和亢奋的看法——但这些看法并没有通过实证检验我们感兴趣的关系。因此,它不是解决我们本章思考题的合适选择。
珍妮·古道尔(Jane Goodall)的经典研究表明,黑猩猩具有复杂的、制造工具的文化,她的研究基于在自然丛林里对黑猩猩的观察。同样,当心理学研究人员想知道人在自然环境中的行为时(相比于实验室的人为条件),他们会采用同样的方法—— 自然观察 (naturalistic observation)。这一方法适合研究育儿实践、购物习惯或人们在公共场合里如何调情。所以我们也就可以在诸如家、购物中心、餐厅,或者荒郊野外等各种地方进行自然观察。
珍妮·古道尔在她对野外黑猩猩行为的开创性研究中使用了自然观察法。
表1-3 调查偏差的常见类型及校正方法
你可能猜到了,自然观察不像实验那样在控制条件下执行,因为研究人员仅观察和记录行为,而不是操纵环境。然而,最好的自然观察会遵循一个经过深思熟虑的计划。因此,通过使用系统的观察和数据收集流程,以及通过对观察者进行悉心培训,我们可以最大限度地减少预期偏差等问题。
自然观察的优点在于,你看到的行为都是自然发生的,这就能揭示出实验环境中无法发现的真相。在某些情况下,利用自然环境也比试图在实验室中重建环境的性价比更高。自然观察的缺点包括两方面,一是缺乏对环境的控制,从而无法得到因果关系的结论;二是一个设计良好的自然观察研究既费时又费钱。
如果让你研究是什么塑造了喜剧演员斯蒂芬·科尔伯特(Stephen Colbert)的幽默感,你会用什么方法?你无法实施任何类型的 实证研究 (empirical research),因为(无论好坏)你只有一个斯蒂芬·科尔伯特。在这种情况下,研究人员必须依靠 个案研究 (case study),这是一种独特的研究方法,它只深入关注一个或几个人,这些人通常都存在着某些罕见的问题或非凡的才能。例如,霍华德·加德纳(Howard Gardner,1993)在他的《大师的创造力》( Creating Minds )一书中,运用个案研究的方法探究了几位创造力非凡的人的思维过程,这几个人包括爱因斯坦、毕加索和弗洛伊德。为发展精神障碍相关理论而进行个案研究的治疗师有时称这种方法为临床方法。不管怎么命名,它的缺点就在于它的主观性、小样本量以及缺乏对可能影响被研究个体的变量的控制。这些局限性严重制约了研究人员得出可以推广或自信地应用于其他人的结论的能力。当然,个案研究有时会为我们提供用其他方法无法获得的有价值的信息。
描述心理学研究中的偏差和伦理问题。
协助自杀、堕胎、死刑,你对这些问题是否有强烈的情绪体验并持有鲜明的观点?
如我们所见,容易引发情绪的话题会导致偏差,让我们很难进行批判性思考。对于那些有兴趣研究诸如虐童、性别差异或种族歧视的影响等问题的心理学家而言,出现偏差的可能性给他们带来了问题——可能正是因为他们对这些主题的鲜明主张使他们对这些主题感兴趣。如果不加以控制,研究人员的偏见就会影响他们的研究设计、数据收集以及对结果的解释。让我们来看看在研究中需要特别警惕的两种偏差。
1. 情感偏差 包括个人珍视的信念、强烈的偏好、确信无疑的假设或个人偏见。对持有这些偏差的人来说,这些偏差往往是不明显的(认识到我们都有情感偏差也非常重要——它们只是我们人性的一个功能)。例如,心理学家罗伯特·格思里(Robert Guthrie)(1998)在他的《连老鼠都是白色的》( Even the Rat Was White )一书中指出,长期以来以大学生为被试的心理学传统研究中存在偏差——这些大学生通常是白人——研究人员却没有意识到他们在抽样过程中引入了偏差。这一做法影响了研究结果对有色人种的适用性。幸运的是,科学方法对同行评议和重复检验持开放态度,为研究人员的情感偏差提供了有力的平衡。尽管如此,科学家们还是更希望在潜在的错误结论发表之前找到并控制他们在研究中的偏差。
2. 如果科学家只关注他们 期望 看到的结果,那么 期望偏差 也会影响他们的结论。(你可以看到它和 证实性偏差 属于近亲。)例如,在一项著名的研究中,心理学系的学生们训练大鼠做出诸如按压杠杆获取食物的行为(Rosenthal & Lawson,1964)。主试告诉一些学生,他们的老鼠特别聪明;其他学生则被告知他们的老鼠的学习速度较慢。(事实上,主试只是从同一窝老鼠中随机挑选出两组。)果不其然,学生们给出的数据显示,被认为聪明的老鼠的表现优于被认为比较迟钝的老鼠——这与学生们的预期一致。怎么会这样?显然,老鼠在热情的观众面前表现得更好!后续的调查问卷显示,拥有“聪明”老鼠的学生表现得更热情、更兴奋、更欢欣鼓舞,对老鼠的表现也更感兴趣。
这些偏差的来源不仅会导向错误的结论,还会产生代价高昂甚至危险的后果。想象一下,如果你是一个为制药公司工作的心理学家,这家公司希望你检测一种新药。尽管你付出了最真诚的努力,但有数百万美元押在检测结果上,你可能就无法完全客观地思考。那么,那些将会给你研究中的病人开这种药的医生会怎样呢?当然,他们和他们的病人都会对这种药寄予厚望。因此,这便为期望偏差搭建了偷偷潜入研究的舞台。
幸运的是,科学家已经开发出一种控制期望偏差的策略,让被试在实验中变“盲”或不知情,不知道他们接受的是真正的治疗还是 安慰剂 (placebo,一种虚假的“药物”或没有医学价值的虚假治疗)。
一种更好的方法是 双盲研究 (double-blind study),它让被试和主试都不知道哪一组正在接受哪一种处理。在一项双盲药物研究中,研究人员和被试(直到研究结束)都不知道谁在服用新药,谁在服用安慰剂。通过确保实验人员不会在无意中将实验组与控制组区别对待,这种科学把戏控制了实验人员的期望。它也控制了那些接受实验研究的人的期望,因为他们对于自己被分配到哪一组也是“盲的”。
可想而知,在我们关于糖的研究中,期望偏差可能会影响孩子们的反应。同样,观察者的期望也会影响他们的判断。为了防止这种情况,我们应该确保儿童、观察者和老师都不知道哪些儿童接受了何种条件的处理。
心理学研究也会涉及严肃的伦理问题,例如,存在被试受到伤害或感到过度痛苦的可能性。没有研究人员会希望这种情况发生,但这些问题并不总是清晰的。例如,在一个关于攻击性的实验中,故意通过侮辱来激怒被试是否道德呢?为了从实验中获得知识,承受多大程度的压力算是得不偿失呢?这样的伦理议题提出了棘手但重要的问题,而且,不是所有的心理学家都会以完全相同的方式回答这些问题。
为了给研究人员提供相应的指导原则,美国心理学会出版了《心理学家的伦理原则和道德准则》( Ethical Principles of Psychologists and Code of Conduct )(2010a)。这份文件不仅涉及保护研究被试免受潜在有害程序的影响的伦理义务,而且还警告研究人员必须对研究过程中获取的个人信息保密(Knapp & VandeCreek,2003;Smith,2003a,2003b)
知情同意 获取 知情同意 (informed consent)是一条重要的伦理准则,它能够确保被试是自愿参与研究的。例如,在我们关于糖的研究中,我们可以像下面所写的这样向家长和老师解释实验的大致情况:
我们计划研究糖对孩子活跃程度的影响。在得到孩子父母允许的前提下,我们为你的孩子所在的三年级班级中的学生设计了一个简单的研究项目。这一研究要求将孩子分为两组:午餐时,一组孩子将被提供含糖的软饮料(七喜),另一组将被提供添加人造甜味剂的相同饮料(无糖七喜)。孩子们不会被告知他们被分到了哪一组。在随后的在校时间里,受过专门训练的观察者会给孩子们的活跃程度打分。我们将分数平均后,得出的结果会显示得到含糖饮料的那一组孩子是否比另一组孩子更活跃。我们会在研究结束后与你们分享研究结果。
欺骗 对心理学研究人员来说,使用欺骗手段是一个特别棘手的问题。正如我们在前文中讨论的,《心理学家的伦理原则和道德准则》提出,在大多数情况下,研究中的被试应当是自愿的且知情的,被试在参与研究前应当知晓他们将面临什么样的挑战,并且可以选择退出研究。但这个问题可能比表面上看起来复杂得多。如果你对“好撒马利亚人”的问题感兴趣:人在什么情况下会帮助一个陷入困境的陌生人?如果你告诉别人你捏造了一个虚假的紧急情况,并且问他们是否愿意帮忙,那么这就会破坏你想要研究的效应。《心理学家的伦理原则和道德准则》允许在某些情况下使用欺骗手段,前提是这不会给被试带来重大风险。
也许你会问:“谁来评判风险?”现在大多数研究机构都拥有监督委员会,也被称为机构审查委员会(IRBs),这个委员会负责审查该机构(如社区学院、大学或诊所)内进行的所有研究。此外,若研究人员使用了欺骗手段,美国心理学会指导准则要求其在研究结束后必须尽快提供 事后解释 (debriefing),以确保被试不会持续遭受被欺骗的不良影响。届时,被试将被告知他们被欺骗的事实、在研究中使用欺骗手段的理由以及他们对研究结果的贡献,因此他们可以提出任何问题,同时理解这一过程。尽管可以采取这些预防措施,一些心理学家仍然反对在任何形式的心理学研究中使用欺骗手段(Baumrind,1985;Ortmann & Hertwig,1997)。
这些就是心理学家为确保他们的研究合乎道德且不会对任何被试造成伤害所必须遵循的一些程序。你觉得自己掌握了吗?请在试一试这一版块测试一下你对这些知识点的理解,看看你是否能发现潜在的道德违规行为。
利维博士是一位教育心理学家,他对影响大学生学习成绩的因素很好奇。一天下午,当他坐在办公室里时,他开始思考课堂上分心会在多大程度上影响学生的考试成绩。他很快在脑海中勾勒出一个实验的想法,以检查分心对考试成绩的影响。他认为现在正是完美的时机,因为他的两节心理学导论课程将在明天迎来本学期的第一次考试!
第二天,利维博士去了第一个班级,并分发了试卷。在没有人知道这门课的这个环节的情况下,利维博士计划在整节课中每隔15分钟按以下顺序分散学生的注意力。
在教室外面的走廊上,一对夫妻假装争执——他们向对方大喊大叫了两分钟。
在教室外面的草坪上,一名草坪保养技术员正在割草。由于窗户是开着的,所以割草机的声音特别大。
最后,当考试接近尾声的时候,利维博士“不小心”打开了一个配有音频的幻灯片。利维博士“假装”他不知道如何关闭程序。
在这门课的另一个班级,利维博士在正常情况下进行测试——教室是安静的,没有干扰或使人分心的事。
当利维博士分析他的研究数据时,他发现分心确实影响了学生在考试中的表现——平均而言,经历了三次分心的班级比没有经历任何分心的班级的得分低了整整一个等级。尽管利维博士计划把他的研究写下来投稿,但他没有向他班上的学生告知任何关于他的研究的信息。
尽管利维博士对他的研究结果很满意,但你会怀疑他违反了一些开展心理学研究的道德准则。
列出他违反了哪些准则。举例支持你的答案。
研究中的社交媒体 你对研究人员从你的Facebook、Twitter或某些论坛中收集你的信息有什么看法?不论喜欢与否,这件事情都正在发生,正如通常新技术出现的那样,在对其好处和潜在缺点进行讨论且做出深思熟虑的决策之前,在采取预防措施以保护用户免受可能的伤害之前,我们往往已经开始使用它了。这一问题在2014年时登上过头条,当时Facebook的研究人员报告说,他们通过平衡用户在订阅的新闻中看到的正面和负面新闻,成功地操纵了用户的情绪(Kramer et al.,2014)。科学家和Facebook用户都对此感到震惊,因为这项实验是在没有得到用户明确同意的情况下开展的。然而,该实验的发起者反驳道,在Facebook用户第一次加入Facebook并接受“使用条款”时,他们就同意了这种个人信息被用于实验的可能性。在那次事件之后,心理学家们开始研究社交媒体网络如何既为研究提供了机会(见图1-8),也带来了挑战(Moreno et al.,2013)。
图1-8 在不侵犯伦理边界的情况下用社交媒体网络进行被动数据收集
注:这里报道的一个发现是,在所有带话题符号(#)的推文中,70%来自移动设备,30%来自台式机或笔记本电脑。收集这些数据不会违反任何对隐私保护的期望,保密性也不会成为问题,因为不会有用户被识别出身份——这些数据是匿名的。
在这个案例中,指的是用户订阅的新闻中的正负情绪基调,同时保持其他条件不变。所以,如果在操纵之后,用户自己的推文变得更消极或积极,研究人员就能确定这种变化是由操纵导致的。但是我们已经学过,参加实验的被试必须提供他们对实验过程的知情同意——在本案例中,他们没有。他们甚至对这个实验一无所知。
机构审查委员会——大学和其他真正的研究机构的“监督委员会”——现在正在针对社交媒体网络研究增添新的指导准则来解决这一问题,以确保未来的研究不会跨越伦理边界。
列出这个问题的利弊。选择一个立场并且做出解释。
对于这个复杂的问题,你的立场是什么?你是否认同Facebook研究人员的说法,他们声称用户在加入Facebook这样的论坛时就同意了使用条款,从而构成对被纳入研究的知情同意?或者,是否应该给被试一个选择退出任何有计划的研究的机会,以及,如果这么做的话,会给研究结果带来偏差吗?在权衡研究结果的收益和可能给被试造成的伤害时,你的底线定在什么地方?
动物研究 另一个长期存在的伦理问题是关于实验动物的使用,例如,大鼠、鸽子和猴子。动物之所以是理想的研究对象,是因为它们的神经系统相对简单,并且在受控条件下容易维持大量的个体数量。当实验程序被认为有风险或完全有害时,例如,在大脑中植入电极以研究各个脑区,动物也可以用作人类的替代品。
大约100年前,美国心理学会的管理者们考虑到动物保护的问题,成立了动物实验预防措施委员会,该委员会编写了动物研究的指导原则(Dewsbury,1990)。最近,美国心理学会在《心理学家的伦理原则和道德准则》中重申,实验人员有义务为实验动物提供良好的生活条件,并且应当权衡给动物造成的不适与研究寻求的信息的价值。1985年美国联邦法律在对动物研究的规定中做出了更多的保护措施。
近年来,对于把动物作为研究被试的担忧开始复苏。当研究涉及造成痛苦或伤害的程序,例如,脑手术、电极植入或疼痛研究时,人们变得特别不安。一些人认为应该采取更严格的限制,尤其是对于用黑猩猩或其他类人动物开展的研究。另一些人认为,应该对所有动物研究采取更严格的限制,包括对于简单动物如海蛞蝓(常用于神经学研究)的研究。虽然许多心理学家支持美国心理学会的指导原则下的动物研究,但这仍然是一个有争议的问题(Bird,2005;Plous,1996)。
既然我们理解了科学方法在确定新闻中说法的可信度方面的重要性,下面让我们来看几个因未能严格遵循这一可靠的体系而导致的严重问题。
1949年,诺贝尔医学奖授给了“额叶切除术”的发明者,这是当时的一种粗暴的脑手术,这种手术将额叶与大脑其他部分的连接切断。手术的初衷是治疗严重的精神障碍,但却导致了数千人的永久性脑损伤。这种手术缺乏严谨的科学基础,它之所以能够流行,是因为希望它起作用的人没有提出批判性质疑。 情感偏差 (在这个案例中,是治愈患有严重心理障碍的人的愿望)推动了盲目的信任,代替了清醒的审视。因此,人们没能客观地检查手术可行的证据。
我们再举一个伪心理学造成有害影响的现代例子。人们普遍相信,积极的想法能够治愈可怕的疾病,例如,癌症。这个想法可能错在哪里呢?一方面,证据并不支持这个观点,即一个人的心理状态会显著影响他从严重身体疾病中康复的可能性(Cassileth et al.,1985;Coyne et al.,2007)。另一方面,态度能让人好转的想法会导致“指责受害者”的情况出现,或者认为患者没有好转是因为他或她的态度不够乐观(Angell,1985)。最后,对于患有严重疾病的患者来说,相较于手术、化疗或其他治疗程序,积极思维提供了一种痛苦和创伤更小的解决方案。因此,他们出于对得到证实的疗法所带来的痛苦和折磨的恐惧,可能会使他们偏向于相信积极思维,而不是更科学有效的疗法。
孤独症谱系障碍——通常被称为孤独症——是一种发育障碍,会导致严重的社会功能和沟通受损。这种神经疾病通常在人生的最初几年被诊断出来,大约1%的人患有这种疾病——而且这个数字可能还在增长。随着对这一疾病的性质和症状的认识的不断提高,家长和研究人员越来越关注这种使人衰弱的疾病的起因,以及它是否可以预防。最近,审查瞄准了儿童疫苗接种这一可能的原因,结果,超过十分之一的家长拒绝或推迟了美国疾病控制中心(CDC)和美国医学协会建议的疫苗接种计划(DeStefano et al.,2013)。但是,这些家长的决定是理性的还是出于恐惧?关于疫苗接种对孤独症患病风险的影响,科学研究揭示了什么?
关键问题是什么?
诚然,所有家长都希望他们的孩子健康,过上富有成效的、充实的生活。所以,一想到他们的孩子可能会患上一种严重限制他们以传统方式建立及维持亲密关系能力的疾病,家长就会恐惧。但是拒绝为孩子接种疫苗真的是规避孤独症风险的方法吗?要回答这个重要的问题,我们需要提出哪些批判性思维问题呢?
观点的来源是哪里?
在过去的10年里,很多热门的媒体都报道了儿童疫苗和孤独症之间的假定联系。但是如你所知,热门媒体并不总是一个可靠的来源。例如,他们经常引用一位医生的话,这位医生出版了一本书,在其中推荐了自制的疫苗接种时间表,用以作为疾病预防控制中心版本的替代版。另一个宣传疫苗接种风险的主要发言人是女演员詹尼·麦卡锡(Jenny McCarthy)。因此,观点的来源缺乏广泛的医学可信度。
证据是什么?
1998年,发表在《柳叶刀》( Lancet )期刊上的一项研究报告了麻疹-腮腺炎-风疹(MMR)疫苗和孤独症之间的联系(Wakefield et al.,1998)。新闻机构对此进行了报道,之后医生们说高达50%的患者重新考虑是否要给孩子接种疫苗。然而,1998年的研究结果被证明是假的:该研究的作者安德鲁·韦克菲尔德(Andrew Wakefeld)接受了律师团给的数十万美元,后者希望证明疫苗是不安全的——更重要的是,《英国医学杂志》( British Medical Journal )后来发现,韦克菲尔德实际上伪造了他的数据(Offit & Moser,2009)!韦克菲尔德曾是一名外科医生,由于那篇文章以及其他各种违反道德的行为,他被吊销了行医执照,最初那篇文章也被《柳叶刀》撤回。从那时起,大量大规模的研究广泛探索了儿童疫苗接种和孤独症之间的联系,但都无济于事——一次又一次地,合法的研究再未能发现两者之间的任何关系(Taylor et al.,2014;Maglione et al.,2014)。国际医学界对儿童疫苗接种不会使其面临孤独症风险这一结果感到满意。这也说明了重复实验,也就是科学方法的第4步的重要性。
相关结论是否存在被偏差污染的可能?
当然如此。孤独症/疫苗谣言中至少存在三种不同类型的偏差。第一,情感偏差解释了一项有问题的研究是如何延续非理性恐惧的,即使在今天,这份恐惧仍然致使一些父母拒绝或推迟为孩子接种疫苗。对于不受控制的疾病的恐惧,加以一个简单的解决方案——不接种疫苗——是一个对许多人来说无法抗拒的强大组合。
第二,证实性偏差也起了作用。1998年的初始期刊文章(后来被撤稿)一发表,媒体就受到了大量孤独症儿童的父母声称孩子确实接种了疫苗的故事的轰炸。一旦家长们在脑海中确定了两者之间的关系(由情感偏差促成),他们就非常容易记住那些故事,但却不会注意或记得还有许多接种过疫苗但没患上孤独症的健康儿童。
第三,相关-因果偏差也在其中添了把火。疫苗抵制者指出,孤独症发病率的上升与儿童疫苗接种率的增加是一致的——因此,他们说,二者之间一定存在相关性。优秀的批判性思考者会指出,相关性并不意味着因果关系:在这种情况下,医疗服务的普及能够解释为什么更多儿童接受早期疫苗接种,以及为什么孤独症的诊断变得更频繁、更可信。
是否需要多元化的视角?
对于任何疾病或障碍,我们必须从先天和后天——生物和环境——两方面去辨别潜在的原因。几乎没有哪个生理或心理障碍是仅由这两种当中的某一种因素造成的,仅由单一的环境因素(比如疫苗)导致一个复杂疾病(例如,孤独症)的情况就更罕见了。事实上,从孤独症患者身上收集的数据反映了好几种基因和遗传风险因素(Jiang et al.,2013)。
我们能够得出什么结论?
这个例子有力地说明了批判性思维的重要性。更糟糕的是,公众对所谓的疫苗-孤独症关系产生不必要且不理性的恐慌,这对公共健康造成了新的威胁。随着拒绝为孩子接种疫苗的家长的增多,那些可通过接种疫苗来预防的疾病的发病率增加了。十几年前,麻疹曾被美国和英国正式归类为“消灭”了的疾病,但它卷土重来,让人担心它可能重新成为流行病:2014年和2015年,美国发现了数百名新病例,而英国发现了数千例。这一疾病具有很强的传染性,在非洲、亚洲、欧洲的许多国家里仍然很常见,每年都有超过15万例儿童死于麻疹。受到感染的旅客会携带病毒进入新的国家,如果没有强有力的疫苗接种史,疾病就会蔓延。卫生部门的官员担心,如果目前抵制疫苗的趋势不尽快逆转,将会抹除数十年来在减少甚至消除的诸如百日咳、白喉甚至脊髓灰质炎等疾病方面获得的成绩。