购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

研究策略:心理学家如何提出并回答问题

心理科学的必要性

学习目标问题 1-1 常识性思维有时是如何引导我们得出错误结论的?

一些人认为,心理学只是证明了我们已知的东西,然后用行话加以修饰:“你用些花哨手段告诉我我奶奶都知道的东西,就能得到报酬?”

的确,奶奶的常识往往是正确的。棒球巨星尤吉·贝拉(Yogi Berra,1925—2015)曾说过:“通过观察,你可以发现很多东西。”(我们还要感谢贝拉的其他名言,如“那里太挤了,没有人再去了”,以及“如果人们不想去球场,没有人能阻止他们”。)我们都是行为的观察者,倘若心理学的许多发现无法被预见,那可太令人惊讶了。例如,许多人都相信爱会带来幸福,这是正确的(正如第11章所说的深层“归属需求”)。

然而,无数次的偶然观察中,奶奶的常识有时也可能是错误的。在后面的章节中,我们将会探讨研究如何颠覆熟能生巧、梦境能预测未来以及大多数人只使用了大脑的10%等流行观点。我们还将探讨研究各种惊人发现,如大脑的化学信使控制人们的情绪和记忆的方式,其他动物具有的能力,以及压力对人们抗病能力的影响。

一些事情看起来像是常识性真理,原因在于人们常常重复听到它们。不管是真是假,仅仅是反复陈述,都会使这些事情更容易被大脑加工和记忆,因此看起来会更真实(Dechêne et al., 2010; Fazio et al., 2015)。因此,一些容易被记住的误解(如维生素C可以预防普通感冒)得以战胜硬道理。这样的谎言通常为人所熟识,其影响也难以消除。它们的力量早已为政治操纵者所熟知,也为批判性思考者所牢记。

常识性思维存在三个常见缺陷:后视偏差、过度自信和在随机事件中感知到规律。它们恰好说明了小说家马德琳·朗格尔(Madeleine L’Engle, 1973)的观点,“赤裸裸的智力是一种极其不准确的工具”。

我们早就知道吗?——后视偏差

试想一下,射箭上靶后再画靶心是多么轻松。股市下跌后,人们总会说股市早“该修正”了。倘若体育教练凭借“大胆的策略”取得比赛胜利,人们就会对其赞不绝口;倘若没有取得胜利,人们则会痛斥其“愚蠢的举措”。一场大战或大选前,其结果往往都是“显而易见”的。尽管历史可能因此看起来是一系列不可避免的事件,但实际的未来很少能被预知。没有人会在日记中写道:“今天,百年战争开始了。”

“生活要向前看,但理解却要向后看。”

——哲学家索伦·克尔恺郭尔

通过告知一组人一个所谓的心理学发现,告知另一组人一个相反的发现,这种 后视偏差 (hindsight bios)能够轻松得到证明。比如,告诉第一组人:“心理学家发现,分居会削弱浪漫对象的吸引力,即‘久别情疏’。”请他们想象为什么会如此。大多数人都可以想到原因,而且在听到解释后,几乎所有人都会认为这个正确的发现不足为奇。

后视偏差:也称为“我早就知道”现象。在得知某一结果后,认为自己会预见到这一结果的倾向。

“任何事情一旦解释清楚,就显得很平常。”

——华生医生对夏洛克·福尔摩斯说

而告诉第二组人相反的情况:“心理学家发现,分居会加强浪漫对象的吸引力,正如俗话说,‘小别胜新婚’。”得知这个虚假结果的人也很容易想到原因,而且大多数人也不会觉得奇怪。然而,两个相反的发现看起来都像常识时,问题就出现了。

人们的回忆和解释中存在这样的错误,表明我们需要心理学研究其原因。这并非说常识通常是错误的,正相反,常识可以很好地描述已经发生的事情,但不擅长预测将要发生的事情。

超过800篇学术论文显示,世界各地的人,无论老少,都存在后视偏差(Roese & Vohs, 2012)。据报道,物理学家尼尔斯·玻尔(Niels Bohr)曾开玩笑说:“预测是非常困难的,尤其是关乎未来时。”

过度自信

我们人类倾向于认为自己所知很多,但实际上没有那么多。在被问及我们对事实问题的答案有多大把握时(如波士顿在巴黎的北边还是南边? ),我们往往对自己不正确的答案过于自信。思考下列三个变位字谜,其答案已在旁边列出(Goranson, 1978):

WREAT → WATER

ETRYN → ENTRY

GRABE → BARGE

过度自信的历史趣事:

“我们不喜欢他们的声音。吉他乐队正在走向衰落。”

——迪卡唱片公司在1962年拒绝了与甲壳虫乐队的录音合同

你认为自己解开这些字谜需要花多长时间?你有没有受到后视偏差的影响?知晓答案往往会使人过于自信(真的“只需要10秒左右的时间就能得出答案”吗?)。实际上,解谜者平均要花3分钟的时间,你可能也要花3分钟才能解开一个没有答案的类似变位字谜:OCHSA

我们能很好地预测社会行为吗?心理学家菲利普·特洛克(Philip Tetlock, 1998,2005)收集了超过27 000份专家对世界大事的预测,如南非的未来、魁北克是否会从加拿大独立。他多次发现:专家们对“自己做出的预测是正确的”的把握平均是80%,但只有不到40%的预测是正确的。事实证明,只有大约2%的人能够出色地预测社会行为。特洛克称此类人为“超级预测者”,他们会避免过度自信。面对困难的预测时,超级预测者会“收集事实,平衡冲突的论点,并确定一个答案”(Tetlock & Gardner, 2016)。

自问

你是否很难相信自己可能过度自信?过度自信会在这种自我评估中起作用吗?阅读有关过度自信的这一节,能够如何帮助你减少过度自信的倾向?

检索练习

RP-1 在朋友开始约会后,为什么我们常会觉得自己早就知道他们注定要在一起?

答案见附录D

在随机事件中感知到规律

人们天生就渴望理解自己所在的世界。人们总会在月球上看到一张脸,在倒放的音乐中听到魔鬼的留言,或者在烤奶酪三明治上看到圣母的形象。即使是随机数据序列,人们也常会发现规律的存在,这是一个奇怪的事实,因为随机序列往往看起来并不随机(Falk et al., 2009; Nickerson, 2002, 2005)。抛掷硬币50次,你可能会对硬币正面或反面的连续出现感到惊讶,就像篮球投篮和棒球击球中所谓的“连续得分”或“连续失分”一样。实际的随机序列中,规律和同类事件连续发生的情形(如重复的数字)出现得比人们预期的更频繁(Oskarsson et al., 2009),这也使得人们很难编写出类似随机的序列。诈骗犯在确定诈骗金额时会尝试模拟随机数字,然而,其非随机的序列会提醒防诈专家(Poundstone, 2014)。

“这个距离上,他们连一头大象都不会击中。”

——约翰·塞奇威克将军在美国内战中被杀前说道

“在我的时代,没有女人会成为首相。”

——玛格丽特·撒切尔

为什么人们总会倾向于寻找规律?对大多数人而言,一个随机的、不可预测的世界是令人不安的(Tullett et al., 2015)。而理解所在的世界可以帮助人们减轻压力,维系日常生活(Ma et al., 2017)。

一些事情,如连续两次中奖,看起来太不寻常,乃至我们很难想象出一个正常的、与概率有关的解释。“但只要有足够大的样本,任何离谱的事情都有可能发生。”统计学家佩尔西·迪亚科尼斯(Persi Diaconis)和费德里科·蒙泰勒(Frederick Mosteller)如是说。一天在10亿人中只发生一次的事件,一天会在全球范围内发生大约7次,一年则会发生2500多次。

“没有任何不寻常事件发生的一天才是真正不寻常的。”

——统计学家佩尔西·迪亚科尼斯

要记住的一点:由于三大倾向——后视偏差、过度自信以及在随机事件中感知到规律的强大影响,常识性思维存在缺陷。但科学探索可以帮助人们从幻觉中筛选出真实的发现。

后真相世界的心理科学

学习目标问题 1-2 为什么我们如此容易相信不实之词?

《牛津英语词典》2017年的年度词汇是“后真相”。该词语描述了一种现代文化,在这种文化中,人们的情绪和个人信念往往凌驾于客观事实之上。

请看美国这两个“真相衰落”的例子——错误信息被广泛传播:

观点:犯罪率正在上升。最近一年,每10个成年人中就有7个告诉盖洛普调查,犯罪情况“比一年前更多”(Swift, 2016)。

事实:几十年来,暴力和财产犯罪率都在下降。2015年,暴力犯罪率还不到1990年的一半(BJS, 2017; Statista, 2017)。

观点:许多移民是罪犯(McCarthy, 2017)。一些重大事件助长了这种说法。移民谋杀、盗窃或撒谎的故事在社交网络和新闻渠道上广为传播,所造成的恐惧在北美,甚至欧洲和澳大利亚都很普遍(Nunziata, 2015)。

事实:大多数移民都不是罪犯。移民入狱的可能性要比土生土长的美国人低44%(CATO, 2017; Flagg, 2018, 2019)。在意大利、英国和其他地方也是如此(Di Carlo et al., 2018)。

政党偏见已经扭曲了美国人的思维。心理学家彼得·迪托(Peter Ditto, 2019a, b)和同事报告称,研究人员发现“自由派和保守派都有党派偏见,而且程度几乎相同”。在美国,大多数共和党人认为,在民主党总统奥巴马的领导下,失业率上升了(实际上下降了);而大多数强硬的民主党人认为,在共和党总统里根的领导下,通货膨胀恶化了(实际上改善了)(Gelman, 2009; PPP, 2016)。一项研究发现,美国民主党人和共和党人都对另一党派的奖学金候选人有偏见(Iyengar & Westwood, 2015)。所以,我们不要自以为是地认为“偏见存在,但对我不适用”,偏见是双向的。

美国民主党人和共和党人都对人们不能区分事实和虚构的情况感到担忧。奥巴马(2017)在其卸任演讲中曾警告,如果没有一个“共同的事实基线”,民主就会受到威胁:“我们在自己的泡沫中感到如此安全,以至于我们开始只接受符合自己观点的信息,无论它是真是假,而不是将观点建立在现有的证据之上。”共和党参议员约翰·麦凯恩(John McCain, 2017)生前同样发出警示:“越来越多的人失去了分辨真相和谎言的能力,甚至没有意愿去这么做。”

那么,用心理学家汤姆·吉洛维奇(Tom Gilovich, 1991)的话说,为什么后真相时代的人经常“知道什么事情并非如此”?

虚假新闻 一些虚假信息是有意灌输给我们的,它们是“披着新闻外衣的谎言”(Kristof, 2017)。2016年美国大选期间,在所有推特推送的新闻中有6%都是假新闻(Grinberg et al., 2019)。并且,捏造的新闻会持续存在。一项对300万人在推特上发布的12.6万个故事的分析发现,虚假信息,特别是虚假政治新闻,“扩散得比真相更远、更快、更深、更广”(Vosoughi et al., 2018)。好消息在于,大多数人通常可以区分高质量和低质量的信息来源(Pennycook & Rand, 2019)。

重复 在实验中,声明在重复后会变得更可信(De keersmaecker et al., 2019)。我们会将反复听到的东西记下来,哪怕是对政治对手的诽谤,并且更加信以为真(Fazio et al., 2015)。

提供有力佐证 在媒体上,“越血腥越能吸引眼球”。媒体报道一些可怕的暴力事件时,如可怕的谋杀、大屠杀和飞机失事等,其生动形象的描述会影响人们的判断。难怪美国人会严重高估他们遭遇犯罪、恐怖活动和飞机失事的可能性。

群体认同和志趣相投者的回声室效应 人们的社会身份很重要。对自己所在群体感觉良好能使人对自己感觉良好。在社交媒体上,人们倾向于与有相同想法的人做朋友(见文前彩图1.1)。人们常会浏览那些支持自己所持观点的新闻,并将那些相反的新闻妖魔化。

好消息是,我们可以采用科学的思维方式来建立一个真实的世界。我们可以带着好奇心、怀疑精神和谦逊,遵循批判性思考的精神:接受一切就是盲目轻信,否认一切就是愤世嫉俗。

科学的方法

好奇心、怀疑精神和谦逊三者相结合的科学态度是所有科学的基础。心理学家们用科学的方法来武装他们的科学态度,这是一个通过观察和分析来评估观点的自我修正过程。心理科学欢迎直觉和听起来很有道理的理论,并对它们进行检验。如果一个理论是有效的,即数据支持其预测,那对这个理论来说就更好了;如果预测失败,该理论就会被修改或否定。研究人员向科学期刊提交研究成果时,同行评审员(该领域的其他科学家)会对其研究的理论、原创性和准确性进行匿名评估。有了这些反馈,期刊编辑才能决定该研究是否值得发表。

构建理论

学习目标问题 1-3 理论如何推动心理科学的发展?

日常对话中,我们常用“理论”这个词来表示“单纯的直觉”。例如,有人可能认为进化论“只是一种理论”,好像它只是一种猜测。在科学领域, 理论 (theory)会提供一套想法来组织观察结果,从而解释行为或事件。理论通过运用更深层次的原理整合零散的事实,起到归纳和简化的作用。当我们将观察到的数据点联系在一起时,一个连贯的画面便呈现出来。

理论:一种解释,使用一套整合原则来组织观察结果并预测行为或事件。

例如,一个关于睡眠影响记忆的理论,能够帮助我们将无数与睡眠有关的观察结果整合为数条简短的原则。假如我们通过多次观察得知,睡眠习惯良好的人在课堂上通常表现优异,在考试时也能发挥良好,那么我们可能会推断:睡眠可以提高记忆力。到目前为止,这一理论运用的效果还不错,我们巧妙地总结了一系列关于良好睡眠的观察结果。

然而,无论一个理论听起来多么合理(例如良好睡眠能提高记忆力似乎很合理),我们都必须对它加以检验。一个好的理论做出的预测是可检验的,这种预测也被称为 假设 (hypothesis)。这种预测会指明哪些结果能够支撑该理论,哪些结果会否定它。为检验睡眠影响记忆的理论,我们可以假设睡眠不足时,人们对前一天的记忆会下降。为了验证这一假设,我们可以评估人们在睡眠良好或睡眠不足的情况下对所学教材的记忆程度(图1.2)。检验结果要么支持这一理论,要么会让我们对其进行修改或否定。

假设:一个可检验的预测,通常由某个理论产生。

图1.2 科学的方法

一个提出问题和观察结果的自我修正过程。

理论会使观察结果产生偏差。当我们推断良好的睡眠会改善记忆效果时,我们可能只看得到自己所期望看到的,从而判定犯困的人说的话不太准确。无论是在实验室内还是实验室外,我们都强烈地想要看到自己所期望的东西,正如人们对气候变化的看法影响了他们对当地天气的解释。

操作性定义:对于一项研究所使用的确切程序(操作)措辞严谨的声明。例如,人的智力可以被操作性定义为智力测试所衡量的东西(也称为操作化)。

心理学家们在报告研究时,对研究程序和概念给予了精确且可度量的 操作性定义 (operational definition),以此作为对自己偏见的检查手段。例如,可以将睡眠不足定义为比该个体的自然睡眠时间“至少少两小时”。(同理,对“攻击性”的研究可以观察你在象征实验伙伴的玩偶娃娃上扎了多少针,或者对“助人为乐”的研究可以记录你的捐款数额。)通过这些措辞严谨的表述,其他人可以用不同的参与者、材料和环境来 复制 (replicate)原始观察。如果他们能够取得类似结果,那么人们对该发现可靠性的信心就会大大增加。例如,对后视偏差的首次研究引起了心理学家的好奇。而现在,在不同的人身上针对不同的问题进行了多次成功的复制实验后,人们证实了后视偏差。复制是进行确认的手段。

复制:对研究的本质进行重复,通常是在不同情况下选用不同参与者,以验证该基本发现是否可以被复制。

复制是科学的重要组成部分。心理学曾经历过一场“可复制危机”,即多个实验室对多达100项研究进行复制,产生了不同的结果,各个研究的可复制率从36%到85%不等(Camerer et al., 2018a; Klein et al., 2014, 2018; Open Science Collaboration, 2015)(本书并未呈现这些不可复制的研究结果)。研究样本较小时,结果往往很难复制,所以心理学家们越来越多地使用大样本研究(Camerer et al., 2018b; Sassenberg & Ditrich, 2019; Stanley et al., 2018)。样本更大,结果可复制的可能性也更大。

如今的心理学研究受益于更高的可复制率、更多的研究数据共享,以及更加严格的研究方法(Dougherty et al., 2018; Smaldino & McElreath, 2016; Zwaan et al., 2018)。越来越多心理学家通过 预注册 (preregistration)来公开交流自己计划的研究设计、假设、数据采集和分析方法(Nosek et al., 2018)。(这种公开透明的制度也防止了后期修改,如改变假设来适应数据。)而探索性研究仍有一席之地,调查人员可以收集数据,并寻找可以激发理论的模式,然后通过确认性研究(预注册的假设和预计划的分析)来对理论进行测试。

预注册:公开交流计划的研究设计、假设、数据采集和分析方法。

探索、复制、预注册和原始数据的开放共享正在实现一场改善科学实践的“心理学的文艺复兴”(Motyl et al., 2017; Nelson et al., 2018)。

心理学和医学也利用了元分析的力量。 元分析 (meta-analysis)是一种用统计学方法综合大量科学证据的程序。通过综合许多研究的结果,研究人员避免了样本小的问题,并得出了最终结论。

元分析:对多项研究结果进行分析以得出总体结论的一种统计程序。

“复制失败不是错误,而是一项壮举,正是它引导我们走上奇妙曲折的科学发现之路。”

——丽莎·费尔德曼·巴雷特

最后,如果我们的理论能够(1)整合观察结果和(2)给出任何人都能用来检验理论或推导实际应用的假设,那么它将是有用的(例如,是否能根据人们的睡眠状况预测他们的记忆保持程度呢?),最终我们的研究可能还会(3)刺激进一步的研究,从而得出能够更好地组织和预测的修正后的理论。

接下来,我们将会学习通过描述法(通常通过案例研究、调查或自然观察来描述行为)、相关法(将不同因素联系起来)和实验法(控制因素以发现其影响)对假设进行检验,并对理论加以完善。为了对流行的心理学主张进行批判性思考,我们需要了解这些方法,以及它们所能得出的结论。

检索练习

RP-2 一个好的理论能够做到什么?

RP-3 为什么复制很重要?

答案见附录D

描述

学习目标问题 1-4 心理学家如何通过案例研究、自然观察和调查来观察和描述行为?为什么随机抽样很重要?

任何科学的出发点都是描述。在日常生活中,我们常会观察和描述他人,总结他们为什么会有这样的想法、感觉和行为。心理学家也是如此,只不过是通过以下方式更加客观系统地进行的:

·案例研究(深入分析个人或群体)。

·自然观察(记录许多人的自然行为)。

·调查和访谈(向人们提问)。

案例研究:一种描述性技术,该技术对个体或群体进行深入研究,旨在揭示出普遍原理。

案例研究 作为最古老的研究方法之一, 案例研究 (case study)对个人或群体进行深入研究,希望能揭示所有人的真实情况。请看下列例子:

弗洛伊德和小汉斯

对5岁的汉斯极度怕马的案例的研究,令西格蒙德·弗洛伊德得出了他的儿童性行为理论。他推测,汉斯对母亲存在无意识的欲望,害怕被父亲这一竞争者阉割,于是将这种恐惧转变成害怕被马咬的恐惧症。正如本书第14章的解释,今天的心理科学不认可弗洛伊德的儿童性行为理论,但确实同意人类的大部分思维都在我们的意识之外运作。

·脑损伤。我们对大脑的早期认识大多来自对某一脑区遭受特殊损伤的人的案例研究。

·儿童的思维。让·皮亚杰(Jean Piaget)仅在仔细观察和询问了几个孩子后,就向我们揭示了儿童的思维方式。

·动物的智力。对各种动物(如黑猩猩)的研究,揭示了它们的理解能力和语言能力。

细致的案例研究有时非常具有启发性,它们往往为进一步研究指引了方向。

但非典型的个案可能会对我们造成误导。无论是在日常生活中,还是在科学领域中,非代表性信息会导致误判和错误结论。事实上,只要研究人员提到一项发现(如吸烟者会死得更早:85岁以上的男性有95%不吸烟),肯定会有人提供一则相反的逸事(噢,我有一个叔叔每天抽两包烟,还活到了89岁)。

戏剧性的故事和个人经历(甚至是心理学案例)会引起我们的注意,并且很容易被记住。记者们最清楚这一点,因此常以重大事件作为他们文章的开头。故事会令人触动,但也会产生误导。下列句子中,你觉得哪句话更难忘呢?(1)“一项对1300个与儿童被绑架有关的梦境报告的研究中,只有5%的人准确预见了孩子的死亡”(Murray & Wheeler, 1937);(2)“我认识一个人,他梦见他的妹妹出了车祸,两天后她就被车迎面撞死了”。数字是令人麻木的,但逸事并不能作为证据。一个据称某人从同性恋转为异性恋的故事并不能证明性取向是可选择的。正如心理学家戈登·奥尔波特(Gordon Allport, 1954, p.9)所说:“只要有一丁点儿(戏剧性)的事实,我们就急于做出像浴缸一样大的概括。”

要记住的一点:个案可以得出富有成效的想法。适用于我们所有人的真理,在我们中的任何人身上都可以窥见,但要找到这些普遍真理,我们必须采用其他研究方法。

检索练习

RP-4 为什么我们不能假设案例研究总能揭示出适用于所有人的一般原则呢?

答案见附录D

自然观察 第二种描述性方法是记录自然环境中的各种反应。 自然观察 (naturalistic observation)的范围包括观察丛林中的黑猩猩社会,摄录和分析不同文化中的亲子互动,记录学校午餐室里学生坐姿的种族差异。在数字时代,自然观察的范围有所扩大,这得归功于从社交媒体和谷歌搜索等收集的“大数据”。

自然观察:一种描述性技术,在自然发生的情境下观察和记录行为,而不试图操纵和控制情境。

直到最近,自然观察大多仍只是“小科学”,可以用笔和纸来完成,而不需要花哨的设备和大笔的预算(Provine, 2012)。但是,如今的数字技术已经将自然观察升级为大科学。只需要使用人们手机的全球定位系统(GPS),就能调查人们去健身房、咖啡馆或图书馆的频率(Harari et al., 2016)。而一些新技术,如可穿戴式相机和健身传感器,以及连接互联网的智能家居传感器等,为人们提供了越来越多的可能性,使人们得以准确记录自己的活动、关系、睡眠和压力(Nelson & Allen, 2018; Yokum et al.,2019)。

数十亿人在网上输入个人信息,也使大数据观察(不披露任何人的身份信息)成为可能。一个研究小组曾通过计算来自84个国家的5.04亿条推特信息中的各种积极和消极词汇,来研究人类情绪的起伏(Golder & Macy, 2011)。如文前彩图1.3所示,人们在周末、起床后不久和晚上似乎会更快乐。(周六晚上通常都很快乐,不是吗?)另一项研究发现,来自美国1347个县的1.48亿条推文中的消极情绪(尤其是与愤怒有关的)词语在预测该县的心脏病发病率方面比吸烟率和肥胖率更准确(Eichstaedt et al.,2015)。谷歌帮助我们了解这个世界,而人们对谷歌的使用能够帮助我们了解他们。例如,通过人们搜索的词语和查询的问题可以确定一个地区种族主义的程度和抑郁症患者的人口占比。但谷歌搜索也揭示了我们人类的普遍相似性,正如不同国家的人在搜索“怀孕”这个词时,都有着相同的对食物的渴望(Stephens-Davidowitz, 2017)。全球各地的人,内在都是相似的。

和案例研究一样,自然观察并不能解释行为,只是描述行为。尽管如此,描述仍可能揭示问题。例如,我们曾经认为只有人类才会使用工具,而自然观察发现,黑猩猩有时会先把棍子插入白蚁堆中,然后抽出,吃掉棍子上的白蚁。这种不引人注意的自然观察为后来对动物思维、语言和情绪的研究铺平了道路,进而扩大了人们对动物伙伴的了解。通过研究人员的观察,我们了解到黑猩猩和狒狒也会使用欺骗的手段——心理学家多次看到一只小狒狒假装被另一只狒狒攻击,以此作为一种诱骗母亲把那只狒狒从食物边赶走的策略(Whiten & Byrne, 1988)。

自然观察也能阐明人类的行为。这里有两个你可能会喜欢的发现:

·一个有趣的发现。人们在社交场合发出的笑声比独处时的笑声多30倍(你有没有注意到自己在独处时很少笑?)(Provine, 2001)。

·文化和生活节奏。罗伯特·莱文(Robert Levine)和阿兰·洛伦萨杨(Ara Norenzayan)在1999年通过自然观察比较了31个国家的生活节奏,包括步行速度、公共时钟的准确性等。他们的结论是:日本和西欧的生活节奏最快,而经济欠发达国家的生活节奏较慢。

自然观察提供了许多有趣的日常生活快照,但这一方法是在没有控制所有可能影响行为的因素的情况下施行的。观察不同地区的生活节奏是一回事,但要理解一些人比其他人走得更快的原因是另一回事。然而,描述也具有启发性:任何科学的出发点都是描述。

检索练习

RP-5 自然观察的优势和劣势是什么?

答案见附录D

调查:一种描述性技术,用于获取特定群体自述的态度或行为,通常通过询问该群体具有代表性的随机样本来实施。

调查 调查(survey)着眼于许多情况,要求人们述说自己的行为或意见,其研究范围包括从性行为到政治见解的方方面面。下列是最近的一些调查结果:

·与20世纪60年代和70年代出生的人相比,20世纪90年代出生的人报告自18岁以来没有性伴侣的人数是前者的两倍(Twenge et al., 2017)。如今这些依恋程度较低的年轻人正在经历一位作家所说的“性衰退”(Julian, 2018)。

·在24个国家中,每两个人中就有一个人表示相信“宇宙中存在外星智慧文明”(Lampert, 2017)。

·68%的人类(约52亿人)称宗教在他们的日常生活中很重要(Diener et al.,2011)。

但是,如何提出问题是个棘手的难题。人们可能会掩饰自己的答案,使之更符合社会期望,比如少报告香烟消费或多报告投票行为。而答案往往取决于问题的措辞和对被调查者的选择。

措辞的影响 即使是提问顺序或措辞的微小变化都会令调查结果产生很大的差异(表1.1)。美国福音派白人基督徒被问及(1)“人类是否随着时间的推移而进化”或(2)“人类从一开始就以其目前的形式存在”时,只有32%的人表示相信进化论(Funk, 2019)。但被问及是否相信(1)“人类随着时间的推移,由于自然选择等过程而进化,上帝或更高的力量没有参与这个过程”,(2)“人类随着时间的推移而进化,在这个过程中有上帝或更高的力量引导或允许”或(3)“人类从一开始就以其目前的形式存在”,超过两倍的人(68%)表示相信进化论。措辞是一个非常微妙的问题,批判性思维者会思考问题的措辞如何影响人们的意见表达。

表1.1 调查措辞的影响

随机抽样 日常思考中,我们倾向对基于观察得到的样本进行归纳,尤其是一些生动的案例。学校管理人员在阅读(1)学生对某个教授评价的统计汇总,以及(2)两个愤怒的学生对某个教授鲜明生动的评论时,受到偏倚样本(2)的影响可能跟受到统计汇总中许多有利评价的影响一样大,并因此基于几个生动但不具代表性的案例进行归纳总结。这种屈从于偏倚样本的诱惑几乎无法抗拒。

随机样本:能够公平代表某一群体的样本,因为每个成员被纳入样本的机会是均等的。

总体:被研究群体的总人数,可从中抽取随机样本(注:除全国性研究外,该术语指的不是国家人口总数)。

那么,如何才能获得代表性样本呢?假如你想了解你所在学院或大学的学生对增加学费的提议有什么看法,通常对整个群体进行调查是不可能的。那么,如何才能挑选出一个能代表所有学生的群体呢?一般情况下,你可以使用 随机样本 (random sample),这样 总体 (population)中每个人都有均等的机会被纳入样本。你可以对学生名单进行编号,并使用随机数字生成器来挑选调查参与者(给每位学生都发问卷行不通,因为那些自觉交回问卷的人并非随机样本)。大型代表性样本要优于小型代表性样本,但100个小型代表性样本要优于500个非代表性大型样本。简单地增加样本人数无法弥补样本代表性不足的缺陷。

在全美范围的选举调查中,政治民意调查员就是这样对选民进行抽样的。如果不进行随机抽样,如各种网站的民意调查之类的大型样本产生的结果往往极具误导性。但是,只需从一个国家所有地区随机抽取大约1500人,就能非常准确地反映出全国性意见。此外,民意调查员还可以询问一些不相关的问题,如受访者是单身还是已婚等,并以政府统计数据为基准评估抽样的准确性(Bialik, 2018)。如果调查样本分布能够与全国人口分类匹配就更好了。

有了大型样本的帮助,预测结果会相当可靠。字母E占了梅尔维尔《白鲸》中925 141个字母的12.3%、狄更斯《双城记》中586 747个字母的12.4%,以及马克·吐温的12部作品中3 901 021个字母的12.1%。据此估计,字母E约占书面英语中字母总数的12.7%(Chance News, 1997)。

考虑到民意调查的误差幅度和最后时刻的选民波动,政治民意调查对可能的结果有一定预测作用,但并不完全准确。2016年美国总统大选前夕,民调分析网站“五三八”预测候选人希拉里·克林顿有71%的胜算。而唐纳德·特朗普当选后,许多人都认为这一预测失败了。但是,预测模型估计一个候选人有71%的胜算时,该候选人也有近三分之一的概率会输(试想一下,天气预报预测有70%的可能性会下雨时,当天一直下雨,这一预测也是有瑕疵的)。一项对1942年至2017年间45个国家的3万个大选预测的总结是:大选结果与流行看法相反,民意调查结果则相当准确(Jennings & Wlezien, 2018)。

要记住的一点:接受调查结果之前,要批判性思考样本的代表性。代表性随机样本是归纳总结的最佳基础。

检索练习

RP-6 什么是非代表性样本?研究人员如何避免这类样本?

答案见附录D

相关关系:两个因素共同变化的程度,也意味着其中任一因素能够预测另一个因素的程度。

相关系数:两个事物之间关系的统计指数(从-1.00到 +1.00)。

变量:任何可变的、可测量的,并且对其的测量符合伦理要求的事物。

相关关系

学习目标问题 1-5 我们所说的两件事情相关是什么意思?什么是正相关和负相关?

描述行为是预测行为的第一步。我们常会从自然观察和调查中得知,一种特征或行为往往与另一种特征或行为同时出现。在这种情况下,我们会说这两者是 相关关系 (correlate)。统计指标 相关系数 (correlation coefficient)能够帮助我们弄清两个事物共同变化的程度,从而了解其中任一事物能在多大程度上预测另一事物。知道考试分数与学业进步的相关关系,我们就可以知道分数能在多大程度上预测学业进步。

在本书中,我们常会问道,两个 变量 (variable)间的相关有多强?例如,同卵双胞胎的性格测试分数间有什么关联?智力测试分数对职业成就的预测程度如何?抑郁症状能在多大程度上预测人们的焦虑?对于这类情况, 散点图 (scatterplot)可以很好地揭示答案。

散点图:一个由点组成的图形群,其中每个点代表两个变量的值。点的斜率表明两个变量之间关系的方向。散点的分布表明相关的程度(散点越集中,表示相关性越高)。

散点图里的每个点代表两个变量的值。图1.4展示了从完全正相关到完全负相关的相关关系散点图(现实世界中,完全相关非常少见)。如果两组分数(如身高和体重)总是一起上升或下降,则为正相关。

说一个相关关系为“负”,并不能说明其相关的程度。如果两组分数变化方向相反,一组分数上升时,另一组分数下降,则其相关关系为负。例如,人们的身高和其头顶到天花板的距离之间的相关关系是完全负相关。

图1.4 显示相关关系的散点图

相关性( r )的范围从+1.00(一个变量的分数随另一个变量的分数增加而增加),到0.00(不相关),到-1.00(一个变量的分数随另一个变量的分数增加而减少)。

统计能够帮助人们了解随意观察中可能遗漏的东西。为证明这一点,雅库布·波拉克(Jakub Polák et al., 2019)和同事收集了2291名捷克和斯洛伐克参与者的问卷,要求参与者们用1~7分的量表来评价他们对24种动物的恐惧和厌恶程度。浏览表1.2的数据,你认为参与者对动物的恐惧和厌恶之间的相关关系是正相关、负相关,还是接近于零?

表1.2 参与者对各种动物的恐惧和厌恶程度

在对表1.2各栏进行比较时,大多数人都没有发现恐惧和厌恶程度之间的关系。事实上,这一假想案例中的相关关系是正相关( r =+0.72),将数据以散点图(图1.5)形式展示,我们就能看到这一点。

如果数据像表1.2一样系统性地呈现时,我们都很难认识到其中的相关关系,那么在日常生活中,我们注意到它们的可能性有多大?为了看清眼前的事物,我们有时需要统计的指引。得到有关岗位级别、资历、业绩、性别和工资的统计汇总信息时,我们能够轻易看出有关性别歧视的证据。但是,相同的信息逐一出现时,我们往往看不到歧视(Twiss et al., 1989)。像心理学家一样思考能够帮助我们平等地看待每个人,而不仅仅是那些引起我们注意的人。

图1.5 对24种动物的恐惧和厌恶程度散点图

本图展示了参与者自述的恐惧和厌恶程度的平均值(每个平均值都由一个数据点表示),图中显示出上升斜率,表明两者之间属于正相关。图中数据相当分散,表明相关性远低于+1.00。

要记住的一点:相关系数体现了两件事物的关联程度,能够帮助我们更清楚地理解这个世界。

检索练习

RP-7 指出下列相关关系是正相关还是负相关。

1.丈夫浏览网络色情内容越多,婚姻关系越差(Muusses et al., 2015)。_______

2.少女花在网络社交媒体上的时间越多,患抑郁症和自杀倾向的风险就越大(Kelly et al., 2018; Twenge & Campbell, 2019)。_______

3.儿童接受母乳喂养的时间越长,后来的学习成绩越好(Horwood & Fergusson, 1998)。_______

4.老年人吃的绿叶蔬菜越多,之后5年的智力下降越少(Morris et al., 2018)。_______

答案见附录D

错觉相关和均值回归

学习目标问题 1-6 什么是错觉相关?什么是均值回归?

相关性不仅会帮助我们清楚看到可能遗漏的关系,还会令我们避免错误地观察到不存在的关系。认为两件事物之间存在关系时,我们可能会注意到并回忆起一些能够证实这一观点的例子。若是相信梦境内容能够预示现实事件,我们可能注意到并回忆起的相符事例会多于不相符的事例。这正是 错觉相关 (illusory correlation)。

错觉相关:认为无关联的两者有关系,或认为两者之间存在比实际更紧密的关系。

均值回归:极端或不寻常的分数或事件向平均值回落(回归)的趋势。

错觉相关会产生一种控制错觉,令人认为偶然事件受到个人掌控。赌徒回想自己玩幸运骰子的经历,可能会认为自己能够影响骰子的滚动,轻抛骰子就能得到较小的数字,而重抛骰子结果则相反。这种不可控事件与个人行为相关的错觉也受 均值回归 (regression toward the mean)的统计现象的影响。平均结果比极端结果更为典型。因此,在不寻常事件之后,事态往往会向其平均水平回归:不寻常事件往往会被更多寻常事件取代。如果学生在测试时的成绩比平时低得多或高得多,那么在重测时,他们很可能会回到自己的平均水平。在第一次测试时表现超出随机水平的超感官知觉(ESP)测试对象,在重新测试时,几乎都失去了他们所谓的“精神力”。

未能发现这一回归是许多迷信和无效做法的根源所在,在体育训练和工作场所中常会发生这样的事。经理在斥责了表现比平时差的员工(或运动员)后,当该员工恢复正常水平时,可能会对其“进步”感到欣慰;而在对员工的出色表现大加赞扬后,当该员工再次向平均水平回归时,则可能会对其感到失望。讽刺的是,回归平均水平会误导我们,令我们在批评他人后感到欣慰(“那次批评真的让他更努力了!”),在赞扬他人后却感到自责(“那些赞美之词让她懈怠了!”)(Tversky & Kahneman, 1974)。

“一旦你对它变得敏感,你会发现回归无处不在。”

——心理学家丹尼尔·卡尼曼

要记住的一点:波动变化的行为恢复正常时,关于其变化的花哨解释往往是错误的,可能是均值回归在发挥作用。此外,相关研究尽管能够揭示各种关系,却并不能解释它们。如果青少年使用社交媒体与其抑郁风险相关(预测),这可能意味着使用社交媒体有抑郁风险,但也可能不是这样,也可能有其他解释(见“批判性思考:相关关系与因果关系”)。

检索练习

RP-8 学校篮球教练跟朋友说,上半场比赛,球队表现非常糟糕,她对球员大喊大叫才保住了球队的连胜纪录。球队表现变好的另一种解释是什么?

RP-9 婚龄与男性脱发呈正相关,是否意味着婚姻会导致男性脱发或者秃顶的男性会成为更好的丈夫?

答案见附录D

实验

学习目标问题 1-7 实验的什么特征使它可以厘清因果关系?

罗马诗人维吉尔(Virgil)曾说:“能够察觉事物原因的人是幸福的。”心理学家如何观察到相关研究中的因果关系,比如未成年少女使用社交媒体与她们患抑郁症和自我伤害的风险之间小的相关?

实验操作 我们的工作从两个简单的事实开始:

1. 2010年开始,全球智能手机和社交媒体的用户激增。

2. 同时,加拿大、美国和英国未成年少女患抑郁症、焦虑症,自我伤害和自杀的概率也急剧上升(Mercado et al., 2017; Morgan, 2017; Statistics Canada, 2016)。

这样的发现意味着什么?两者之间是否存在因果关系?如果是这样,父母应不应该限制他们上初中的子女使用照片墙(Instagram)或色拉布(Snapchat)的时间?即使是来自一百万青少年的超大样本得出的相关关系也无法回答我们。答案仍在争论之中,数据得出的结果也不一致。除了简单的相关关系外,一份研究摘要指出,在八项纵向研究(研究随时间推移的变化)中有六项研究表明,当前青少年对社交媒体的使用预示了其未来的心理健康问题(Haidt, 2019)。即便如此,为确定原因和结果,研究人员也必须进行 实验 (experiment)。在实验中,研究人员能够通过操纵感兴趣的因素和保持其他因素不变(即“控制”)来分离出一个或多个因素的影响。为达到这一目的,他们通常会建立一个 实验组 (experimental group),让人们接受操纵,如减少屏幕使用时间,并建立一个人们不接受操纵的 对照组 (control group),以进行对比。

批判性思考:

相关关系与因果关系

学习目标问题1-8 为什么相关关系能够预测却无法解释因果关系?

1. Belluck, 2013。2. Fielder et al., 2013; Willoughby et al., 2014。3. Resnick et al., 1997。4. 答案:(1)父母的爱可能会让青少年更健康。(2)表现良好的青少年可能会更多地感受到父母的爱和认可。(3)某些其他因素可能会影响父母的爱和青少年的行为,如家庭收入或社区环境。

实验:一种研究方法,研究人员通过操纵一个或多个因素(自变量)来观察其对某些行为或心理(因变量)的影响。研究人员旨在通过随机分配参与者控制其他相关因素。

实验组:在一个实验中接受操纵,即改变某种自变量的组。

对照组:在一个实验中没有接受操纵,与实验组形成对比,作为评价操纵效果的比较组。

随机分配:通过将参与者分配到实验组和对照组,从而使不同组之间预先存在的差异最小化。

为使两组之间预先存在的差异最小化,研究人员将人们 随机分配 (randomlyassign)到两个组中。无论是用随机数字表还是抛掷硬币,随机分配都能有效地使两组人是等效的。在一个实验中,如果有三分之一的参与者可以让耳朵扭动起来,那么每组中都有大约三分之一的参与者可以做到。年龄、态度和其他特征在实验组和对照组中也是相似的。因此,如果在实验结束时两组人有差异,我们就可以推测出操纵有效果(注意随机抽样和随机分配的区别,前者创造了一个代表性调查样本,后者则使实验组和对照组更加均衡)。

那么,关于未成年少女使用社交媒体与她们患抑郁症和自我伤害风险之间的关系的实验表明了什么?尽管真正改变社交媒体使用的实验很少,但在另一个实验中,有近1700人同意停用他们的脸书(Facebook)账户四周时间(Allcott, 2019)。与对照组的人相比,那些被随机分配到停用账户组的人花了更多时间看电视和与家人朋友互动,他们报告的抑郁症数量较低,对生活的幸福感和满意度更高,而且实验后也更少使用脸书。少玩会儿脸书,生活更加幸福。

人们对长期使用社交媒体的影响争论不休。目前,大多数研究人员都认为青少年无限制地使用社交媒体会带来一定程度的心理健康风险。随着进行更多大规模的相关研究和纵向研究,以及进一步的实验,研究人员将逐渐完善这一暂定结论。

要记住的一点:相关研究揭示了自然发生的关系,实验通过操纵一个因素来确定其影响。

程序和安慰剂效应 那么,考虑一下我们如何评估治疗中的干预措施呢?在生病或情绪低落时,我们倾向于寻求新的治疗办法,而这可能会产生误导性的证据。如果我们在感冒三天后开始服用锌片,发现感冒症状减轻了,我们可能会认为是药物的功劳,而不是感冒的自然缓解。在18世纪,放血疗法似乎很有效,人们有时在接受该疗法后会有所好转;如果他们没有好转,医生就会推断疾病已经到了无法逆转的程度。因此,无论一种疗法是否真正有效,使用者都有可能认可它。为了确定其疗效,我们必须控制其他因素。

而这正是对新药和新的心理治疗方法进行评估的方式(见第16章)。研究人员将这些研究的参与者随机分配到各研究小组。一组接受假性治疗——使用无药效的安慰剂(一种外观相同但不含药物成分的片剂),而另一组接受真正的治疗,如服用抗抑郁药物。参与者对于他们所接受的治疗通常都是“盲目的”,即不知情的。如果该研究采用 双盲测试 (double-blind procedure),则参与者、药物管理者和数据收集者都不知道哪一组在接受治疗。

双盲测试:一种实验测试,在测试过程中,研究参与者和研究人员对研究参与者是否接受了治疗或安慰剂都一无所知(盲目)。常用于药物评价研究。

安慰剂效应:(pluh- SEE-bo;拉丁文,意思是“我将取悦”)仅由期望引起的实验结果;使用无效的物质或引入无效的条件,参与者由于误将其当作有效因素而导致的对行为的任何影响。

自变量:在一个实验中,被操纵的因素;实验是为研究其变化产生的影响。混淆变量:除被研究的因素外,可能影响研究结果的因素。

因变量:实验中被测量的结果;当自变量被操纵时,可能发生变化的变量。

在双盲测试中,研究人员检查的是治疗的实际效果,而非参与者和研究人员对其疗效的信念。只要想到自己正在接受治疗,就能让人精神振奋,身体放松,症状得到缓解。这种 安慰剂效应 (placebo effect)在减少精神分裂症患者的疼痛、抑郁、焦虑和听觉幻觉方面有大量记录(Dollfus et al., 2016; Kirsch, 2010)。运动员服用所谓可提高表现的药物后跑得更快(McClung & Collins, 2007);喝无咖啡因咖啡的人报告称,在他们觉得饮品中含有咖啡因时,他们的活力和警觉性提高了(Dawkins et al., 2011)。人们服用虚假的情绪改善药物后感觉更好(Michael et al., 2012)。安慰剂越贵,对我们来说就越“真实”,价格为2.5美元的假药比10美分的假药效果更好(Waber et al., 2008)。要真正了解一种疗法的有效性,研究人员必须控制可能会出现的安慰剂效应。

检索练习

RP-10 研究人员采取了什么措施来防止安慰剂效应混淆研究结果?

答案见附录D

自变量和因变量 我们接下来看一个更有说服力的例子:药物万艾可(俗称伟哥)在经过21次临床试验后获批使用。其中一项试验是研究人员将329名患有勃起障碍的男性随机分配到实验组(服用伟哥)或对照组(服用安慰剂)。这个过程是双盲的,服药者和发药者都不知道参与者服用的是什么。结果显示:在峰值剂量下,有伟哥协助的成功案例占69%,而服用安慰剂的成功案例只有22%(Goldstein et al., 1998)。

这个简单的实验只操纵了一个因素:药物(服用伟哥与未服用伟哥)。我们把这个实验因素称为 自变量 (independent variable),因为我们可以单独改变它而不影响其他因素,如男性的年龄、体重和个性。其他有可能影响研究结果的因素被称为 混淆变量( confounding variable)。随机分配控制了可能的混淆变量。

自变量:在一个实验中,被操纵的因素;实验是为研究其变化产生的影响。

混淆变量:除被研究的因素外,可能影响研究结果的因素。

因变量:实验中被测量的结果;当自变量被操纵时,可能发生变化的变量。

实验研究了一个或多个自变量对某些可测量行为的影响,并称其为 因变量 (dependent variable),这种变量可以根据实验中发生的情况而变化。自变量和因变量都有精确的操作定义,其中规定了操纵自变量(即本研究中确切的药物剂量和时间)或测量因变量(即男子对其性表现问题的反应)的程序。这些定义提供了一定程度的准确性,以便其他人能够重复这项研究(见图1.6中的脸书实验设计)。

随机分配(控制其他混淆变量,例如人格和环境)

图1.6 脸书实验

为了辨别因果关系,研究人员通过随机分配一些参与者到实验组,另一些参与者到对照组来控制混淆变量。测量因变量(抑郁症测试分数)以确定自变量(社交媒体接触)的影响。

让我们暂停一下,做一个简单的心理学实验,确保你理解了内容。为了测试房东对租房者种族的感知对其邀请租房者看房的影响,阿德里安·卡普索(Adrian Carpusor)和威廉·罗格斯(William Loges)在2006年的研究中向洛杉矶地区1115名房东发送了措辞相同的询问电子邮件。研究人员改变了发件人姓名中包含的种族身份信息,并跟踪研究了积极答复(即邀请他们亲自去看房)的百分比。其中,“帕特里克·麦克杜格尔”(Patrick McDougall)、“赛义德·拉赫曼”(Said Al-Rahman)和“泰瑞尔·杰克逊”(Tyrell Jackson)分别收到89%、66%和56%的邀请。在这个实验中,什么因素是自变量?什么因素是因变量呢?

实验也可以帮助我们评估社会项目。早期儿童教育计划能否提高贫困儿童的成功机会?各种反吸烟运动有什么效果?学校的性教育计划能否减少青少年怀孕的情况?为了回答这些问题,我们可以进行实验。如果一项干预措施效果极佳,但资源有限时,我们可以用抽签的方式,随机分配一些人或地区体验新的项目,而其他的人则作为对照组。如果后来这两组人有差异,那么干预的效果就有据可依(Passell, 1993)。

“(我们必须防范的)不仅是种族诽谤,而且要……防范微妙的冲动,例如给强尼工作面试机会,而不给贾马尔。”

——美国前总统贝拉克·奥巴马

让我们来回顾学过的内容。变量是任何可以变化的东西,如婴儿营养、智力、社交媒体接触等任何在可行和道德的范围内可以测量的东西。实验的目的是操纵自变量,测量因变量,并控制混淆变量。一个实验至少有两个不同的组:一个实验组和一个对照或控制组。随机分配的作用是在任何操纵效果发生之前,尽量减少各组之间预先存在的差异。这样,一个实验至少可以测试一个自变量(我们操纵的因素)对至少一个因变量(我们测量的结果)的影响。

检索练习

RP-11 通过随机分配,研究人员能够控制______,这是除自变量以外可能会影响研究结果的因素。

RP-12 将左边的术语(i—iii)与右边的描述(a—c)相匹配。

RP-13 为什么在测试一种控制血压的新药时,在1000名参与者中,给一半人服用药物会比给所有参与者都服用药物更能了解其效果?

答案见附录D

研究设计

学习目标问题 1-9 你如何知道要使用哪种研究设计?

在本书中,你将学习到心理科学相关的各种神奇发现。但是,为得到有意义的结果,心理学家们会如何选择研究方法并设计他们的研究呢?了解研究如何进行,即如何开发和研究可检验的问题,是理解整个心理学的关键。表1.3比较了心理学各种主要研究方法的特点。在后面的章节中,你将学习到其他研究设计,包括双生子研究(第4章)以及横断研究和纵向研究(第10章)。

表1.3 研究方法的比较

在心理学研究中,除了无法检验(或不道德)的问题外,如自由意志是否存在、人是否生来邪恶以及来世是否存在等,没有任何问题是不允许研究的。尽管心理学家们无法检验这些问题,但他们可以测试自由意志观点、攻击性人格以及来世的观点是否影响人们的思考、感受和行为(Dechesne et al., 2003; Shariff et al., 2014; Webster et al.,2014)。

选定研究问题后,心理学家会选择最合适的研究设计,如实验研究、相关研究、案例研究、自然观察、双生子研究、纵向研究或横断研究,并决定如何最有效地对其进行设置。他们会考虑可用的资金和时间、伦理问题以及其他限制。例如,研究儿童成长的研究人员采用实验法将儿童随机分配到温馨的家庭或严厉的家庭中,这种做法是不道德的。

接下来,心理学家会决定如何衡量所研究的行为或心理过程。例如,研究攻击性行为的研究人员可以衡量参与者是否愿意用所谓的强烈噪声轰击陌生人。

研究人员希望对研究结果更自信,所以还会仔细考虑混淆变量。

心理学研究是一种创造性的冒险。研究人员要设计每项研究,测量目标行为,阐释所得结果,并在此过程中进一步了解行为和心理过程的迷人世界。

自问

你会选择哪个心理学问题进行研究?你将如何设计此项研究?

预测日常行为

学习目标问题 1-10 简化的实验室条件能阐明日常生活吗?

在看到或听到心理学研究时,你是否会好奇,人们在实验室里的行为能否预示他们在日常生活中的行为?在黑暗的房间里探测微弱的红光闪烁,是否可以应用于飞机夜间飞行?观看了暴力色情片后,男性更愿意朝女性按下所谓的播放噪声按钮,这是否真的说明观看暴力色情片增加了男性虐待女性的可能?

回答上述问题之前,我们需要了解,研究人员意图将实验室环境打造为简化的现实环境,从而模拟和控制日常生活的重要特征。正如风洞能够让飞机设计师在控制条件下再现气流的力量,实验室实验能够让心理学家在控制条件下再现心理力量。

实验的目的不是精确地复制日常生活中的行为,而是检验理论原理(Mook, 1983)。在攻击性研究中,决定是否按下噪声按钮与打人耳光可能不一样,但原理是一样的。有助于解释日常行为的正是由此得出的原理,而非具体的发现。

心理学家在将有关攻击性的实验室研究应用于实际暴力事件时,采用的是攻击性行为的理论原理,这些原理是他们从许许多多的实验中提炼出来的。同样,研究人员也会将从实验室环境的实验(如在黑暗中看红灯)中得到的视觉系统原理应用于更复杂的行为,如夜间飞行等。许多调查表明,实验室中得出的原理通常可以推广到日常生活中(Mitchell, 2012)。

要记住的一点:心理科学关注的不是特定的行为,而是揭示有助于解释许多行为的一般原理。

心理学的研究伦理

学习目标问题 1-11 为什么心理学家要研究动物?什么研究伦理准则能够保障人类和动物的福祉?心理学家的价值观如何影响他们的研究以及成果的应用方式?

我们回顾了科学的方法是如何抑制偏见的,学习了案例研究、自然观察和调查如何帮助我们描述行为,还注意到了相关研究能够评估两个因素之间的联系,表明一个因素能够在多大程度上预测另一个因素。(我们研究了实验的基础逻辑,即使用对照组和随机分配参与者以分离出自变量对因变量的影响。)

然而,即使了解了这么多,你对心理学的态度可能仍然是好奇和忧虑参半的。因此,在投身心理学之前,我们先来讨论心理学伦理和价值观的一些常见问题。

研究和保护动物

许多心理学家热衷于研究人类以外的动物,对它们感到痴迷,希望了解不同物种的学习、思考和行为方式;而其他心理学家研究动物则是为了了解人。人类不是“像”动物,人类就是动物,有着共同的生物学特性。因此,动物实验也为一些人类疾病带来了治疗方案,例如治疗糖尿病的胰岛素,预防脊髓灰质炎和狂犬病的疫苗,取代缺陷器官的移植疗法。

人类是复杂的,但人类的一些学习过程同样也存在于其他动物中,甚至存在于海蛞蝓和蜜蜂之中。海蛞蝓简单的神经系统恰恰令其对学习的神经机制研究充满了启发性。同样,蜜蜂们在学习如何应对压力方面也与人类非常相似(Dinges et al.,2017)。

我们与动物有着这样的相似之处,不应该更尊重这些动物亲戚吗?动物保护运动对使用动物进行心理学、生物学和医学研究表示抗议。罗杰·乌尔里希(Roger Ulrich,1991)指出:“我们不能以动物与人类之间的相似性来为与动物有关的科研工作进行辩护,然后再以差异性来为其进行道德辩护。”在美国的全国性调查中,赞成和反对“使用动物进行科学研究”的成年人各占一半,其中更了解科学的人表示支持的程度更高(Strauss, 2018)。

在这场激烈的辩论中,出现了两个问题。其中的基本问题是将人类的福祉置于其他动物的福祉之上是否正确。在有关压力和癌症的实验中,为避免人类患肿瘤而令小白鼠得肿瘤的做法正确吗?在研发艾滋病疫苗的过程中,是否可以让猴子接触类似HIV的病毒呢?人类每年会饲养和宰杀560亿只动物(Thornton, 2019),我们对其他动物的使用和消费是否像老鹰、猫和鲸鱼这些肉食性动物的行为一样符合自然法则呢?

“老鼠与人类非常相似,只是它们不会蠢到买彩票。”

——戴夫·巴里

“请不要忘记那些患有不治之症或残疾的人,他们希望通过动物研究来治疗疾病。”

——心理学家丹尼斯·菲尼

“一个国家是否伟大,可以从它对待动物的方式来判断。”

——圣雄甘地

对于那些将人的生命放在首位的人来说,出现了第二个问题:应采取怎样的安全防护措施保护研究中动物的福祉?对动物研究人员的一项调查给出了答案。有大约98%的人支持政府制定保护灵长类动物、狗和猫的法规,有74%的人也支持制定为研究用鼠类提供人道关怀的法规(Plous & Herzog, 2000)。许多专业协会和资助机构也已经有了这样的指导方针。英国心理学会(BPS)的指导方针呼吁在合理的自然生活条件下饲养动物,并为社会性动物提供伴侣(Lea, 2000);美国心理学会(APA)的指导方针指明,研究人员必须提供“人道关怀和健康的条件”,所做的测试应“尽量减少不适”(APA, 2012);欧洲议会也规定了有关动物护理和饲养的标准(Vogel, 2010)。大部分高校都会对研究方案进行审查,审查工作通常由动物护理伦理委员会负责,各种实验室也会受到监管和检查。

动物自身也能够从动物研究中受益。俄亥俄州的一个心理学研究团队测量了每年送到动物收容所的数百万只狗的应激激素水平。他们在研究中设计了应对和抚摸的方法,以缓减狗的压力,帮助它们从收容所过渡到收养家庭(Tuber et al., 1999)。其他一些研究也帮助提高了动物自然栖息地的护理和管理水平。一些实验揭示了人类与动物的行为亲缘关系,以及黑猩猩、大猩猩和其他动物的非凡智慧,大大增加了人们对它们的同情和保护意识。在最好的情况下,关注人类并尊重动物的心理学研究能够同时造福人类与动物。

研究和保护人类

那么,人类参与者又面临着什么呢?那些穿着白大褂、似乎要给人进行电击实验的科学家形象是否让你感到不安?实际上,大部分心理学研究是没有这种高压刺激的,更常见的是闪烁的灯光、闪动的文字和愉快的社交互动。

偶尔,研究人员也会暂时给参与者施加压力或欺骗参与者,但只会在他们认为这对达到合理目的必不可少时才会实施。比如,了解和控制暴力行为或研究情绪波动时。如果参与者事先知道一切,一些实验就不会成功(为了提供帮助,参与者可能会试图证实研究人员的预测)。

英美两国心理学会的道德规范敦促研究人员:(1)获得潜在参与者对参加研究的 知情同意 (informed consent);(2)保护参与者免受超出寻常水平的伤害和感到不适;(3)对参与者的个人信息保密;(4)进行全面的 事后解释 (debrief)(事后解释研究内容,包括研究所采取的任何暂时性欺骗行为)。为了落实这些道德标准,许多大学和研究机构都设置了审查委员会,负责审查研究提案,保障“人类研究参与者的权利、福利和福祉”(NIEHS, 2019)。

知情同意:向潜在参与者提供足够多的研究信息,使他们能够选择是否参与实验。

事后解释:实验后,向参与者解释研究内容,包括研究目的和采取的任何欺骗行为。

确保科学的诚信

在科学领域,出现错误是难免的。偶尔的数据计算失误或误报是可以原谅和改正的,但造假是不可接受的,这会让科学家被驱逐出这个行业。事实上,许多顶尖科学家都将诚实看作最重要的科学品质,其次才是好奇心和毅力(Nature, 2016)。为谋求职业发展剽窃他人文字观点或编造数据,最终只会落得职业生涯终止的下场。一个罕见案例就是如此,一个荷兰心理学家捏造数据,将其编入了58篇研究文章,这一造假行为最终还是被其警觉的同事发现了(Retraction Watch, 2015)。

假科学还可能造成巨大的伤害。1998年,一位现已被吊销执照的英国医生安德鲁·韦克菲尔德(Andrew Wakefield)在著名杂志《柳叶刀》上发表了一篇文章,报告了十几例英国儿童接种麻疹、腮腺炎和风疹(MMR)疫苗后出现孤独症的情况。而其他研究未能复制这一发现(研究可重复非常重要!)(Hviid et al., 2019)。直至后来,一项调查揭示了其伪造数据的行为,于是该杂志撤回了该报告(Godlee, 2011)。然而这时,这一发现已被广泛宣传,成了“过去100年中最具破坏性的医学骗局”(Flaherty,2011),并且引发了一项“反疫苗”运动,导致疫苗接种率大大下降,并导致美国的麻疹发病率并未遵循疾病消除的典型路径,在2019年上升到了25年来的最高水平(CDC,2019; Graham et al., 2019)。未接种疫苗的儿童还可能遭受长期伤害,甚至面临死亡危险,同时也令那些年龄太小而无法完全接种疫苗的儿童处于危险之中。尽管科学能够自我纠正,造成的伤害却挥之不去。然而,好消息是,科学审查以及复制研究能够为人们提供信息和保护。

心理学的价值观

研究人员的价值观会影响研究内容、研究方式以及对研究结果的解释,也会影响研究课题的选择。例如,我们应该研究工人的生产力还是工人的士气,性别歧视还是性别差异,顺从性还是独立性?价值观会影响我们的观察结果和解释。有时候,我们只看得见自己想要看到或期望看到的东西(图1.7)。

甚至我们描述特征时倾向的词语也会反映我们的价值观。在心理学和日常对话中,标签既是描述也是评价:僵化还是稳定,信仰还是盲信,通奸还是开放式婚姻?我们给他人贴上坚定或固执、细心或挑剔、谨慎或苛求的标签,也揭示了我们自己的态度。

因此,价值观会影响心理科学,而心理科学具有说服力。这也可能引起一些人的怀疑:心理学的力量是否很危险?它可能被用于操纵他人吗?如同所有其他力量一样,知识可以用来做好事,也可以用来做坏事;核能可以为城市供能,也可用来摧毁城市;说服力可以用来教育人们,也可以用来欺骗人们。尽管心理学确实有欺骗他人的力量,其目的却是为了启迪他人,心理学家们一直在探索提高学习能力、创造力和同情心的方法。心理学涉及世界上的许多重大问题,如战争、人口过剩、不平等、气候变化、偏见、家庭危机、犯罪等,所有这些问题都与人的态度和行为有关。心理学还会涉及人们对滋养、爱和幸福最深切的渴望,它不能解决生活中的所有重大问题,但它会涉及其中一些非常重要的问题。

图1.7 你看到了什么动物?

我们的期望影响了观察到的事物。你在图(a)中看到的是鸭子还是兔子?向其他朋友展示这张照片,并把兔子的照片(b)遮住,看看他们是否认为这是鸭子(灵感来自Shepard, 1990)。

肯尼斯·克拉克(1914—2003)和玛米·克拉克(1917—1983)

1954年,在做出废除学校种族隔离的历史性决定时,美国最高法院引用了心理学家肯尼斯·克拉克和玛米·克拉克(1947)的专家证词和研究。克拉克夫妇报告称,让非裔美国儿童在黑人和白人玩偶之间做出选择时,他们大部分都选择了白人玩偶,这表明他们可能已经吸收并内化了反黑人的偏见。

自问

你对心理学还有哪些问题或担忧?

检索练习

RP-14 如何保护研究中的动物和人类参与者?

答案见附录D hR30xqK1GfGeiTiw9pwUlX3mwJbHaC2/nhyPoAPtgyfrD/NNR2ddy2azTRIuHNvg

点击中间区域
呼出菜单
上一章
目录
下一章
×