教育心理学新编（第四版）最新章节_燕良轼著

第三节怎样研究教育心理学

在讲授教育心理学课程时，经常会有学生问：怎样研究教育心理学？下面，笔者结合自己多年的教学实践与科研实践，尝试从基本研究过程、研究方法的选择与提高教育心理学科研能力的策略等三个方面对它进行详细的探讨。顺便指出，假若一个人想要熟悉课题论证的基本内容，只要熟悉本节内容，然后按如下五个方面组织论证即可：①课题的价值；②文献综述；③课题的研究思路；④课题的研究步骤、方法与手段；⑤课题的可行性分析（主客观条件）。同时，在论证课题时若能做到创新性、共识性和操作性的有机统一，那申报成功的概率就会大增。

一、教育心理学的基本研究过程

心理学的研究过程一般分为两个主要阶段，它们通常是依次发生的：发现问题并形成假说或假设（发现），然后去检验它（验证）。换言之，“提出假设”和“验证假设”是科学研究尤其是实验研究的两个基本步骤。教育心理学的研究亦然。

（一）发现问题，形成并提出假设或假说

在做学术研究时，“对象”与“方法”的问题是一个必须认真考虑的问题：对象与方法，何者为先？何者为重？对于这个问题的回答，要点有二：一是论先后，宜以对象为先。也就是说，宜优先考虑研究对象，不能“避重就轻”“避难从易”，不能像当年行为主义者那样，为了保证研究方法的客观性，将心理学的研究对象局限在“行为”上，而将当时不太好做客观研究的“意识”、脑这个重要的“黑箱子”统统给抛弃了。二是论轻重，宜以方法为重。研究对象确定好以后，宜综合考虑对象的自身特点与自己的知识背景等因素，选择最佳方法对其进行研究。因为方法的恰当与否，常常是决定研究能否获得实质性进展乃至质的突破的重要因素之一。这一小节主要探讨研究对象的选择，研究方法留待下一小节探讨。

1.发现问题

（1）怎样发现问题。

科学研究开始于人们对未知现象及其间的关系产生的疑问。尽管产生研究问题的来源颇多，一般而言，可以将之概括为三种情况：

第一，原有知识的缺乏与困惑。产生与发现问题最明显的情况是缺乏知识。只要个体对某个事情或现象缺乏了解，不论是来自日常生活的直接观察（即对环境中的事件、人物和动物的直接观察）或个人经验，还是来自研讨过去的研究文献或现有理论学说（一些问题被看作从早期学者中传下来的“伟大的但没有答案的问题”），都会对该事物或现象产生疑问。这些疑问促使个体去寻求信息，探讨并寻找问题的答案。换言之，当人们面对一个事实或一个新现象，无法用现有知识予以解释或说明时，就产生了一个或多个新问题。

第二，不同研究之间相互矛盾或不一致。假若几个探讨同样问题的研究发生矛盾，或得出不一致的结论，那么，新的问题就产生了。

第三，有的问题来源于研究者的奇思妙想，或者是对日常生活经验的推想，或者是对文本（包括书籍、论文等）里记载的某项研究或某一理论的推论。

（2）怎样发现一个适合自己研究的“好问题”。

对于个体而言，通过上述三种途径发现的问题，并不是每一个都适合自己的。如何才能确定一个适合自己研究的“好问题”呢？这就要综合考虑以下三个方面的因素。假若全盘考虑后，发现某一主题适合自己去研究，那它对自己而言就是一个“好问题”，反之亦然。

①问题的价值或意义。

任何一个问题若有学术价值，一般主要体现在以下三个方面，当然，这三个方面的不同排列组合（包含不同的质或量），则是千差万别，正所谓“正奇相生，其变无穷”。

一是理论上的价值。假若一项学术研究所取得的研究成果能够在理论上增进人们对某一主题的理解或认识，那么，此项学术研究就具有一定的理论价值。例如，皮亚杰（J.Piaget）通过自己的辛勤研究而提出的认知发展理论，能够增进人们在理论上对个体认知发展的理解，因此，皮亚杰的这项研究就具有理论上的价值。

二是应用上的价值。如果一项学术研究所取得的研究成果能够在应用水平上增进人们对某一主题的认知及操作能力，那么，此项学术研究就具有一定的应用价值。例如，安德森（Anderson,1985）将语文知识分为陈述性知识（declarative knowledge）与程序性知识（procedural knowledge）两大类，这样的分类有助于人们更好地学习这两大类知识，所以，安德森的这项研究就具有应用上的价值。

三是学科建设上的价值。如果一项学术研究所取得的研究成果能够促进某一学科的发展，那么，此项学术研究就具有一定的学科建设价值。例如，柯尔伯格（L.Kohlberg）提出道德认知发展理论对于德育心理学的发展具有重要意义，相应地，对于德育心理学或教育心理学而言，柯尔伯格的这项研究就具有学科建设上的价值。

②影响研究的个体与环境因素。

一项研究具有学术价值，是否就一定适合自己呢？答案显然是否定的。事实上，无论在哪一个学术领域，都存在大量有学术价值的研究主题。不过，由于某些因素的制约，其中有许多主题是不适合某些研究者做的。那么，应该怎样去判断其可行性呢？这就要进一步综合考虑两方面的因素：

一是来自研究者自身的因素。它包括研究者的科研兴趣、学术背景或已有知识经验、思维方式、身心健康状态与人格特征等。身心健康状态与人格特征一看就明白，不多讲，只简要谈一下其他三个因素。俗话说：“兴趣是最好的老师。”如果你对某一有学术价值的问题颇有兴趣，那么，就可以尝试去研究它；假若对它不太感兴趣甚至毫无兴趣，如果有选择的可能，就不要去研究它。毕竟，让自己长期与一个自己不感兴趣的问题打交道，这是一件非常不愉快的事情。自己已有的学术背景或已有知识经验也是选择研究主题时宜考虑的一个重要因素。如果你不具备扎实的理科学术背景，一般而言就不宜选择“认知神经科学”作为自己的主攻科研方向；如果你没有扎实的国学功底，研究中国古代教育心理学思想时就会非常吃力。自己的思维方式同样是选择研究主题时宜考虑的一个重要因素。例如，就思维方式而言，一个习惯动作思维的人可以选择应用领域的研究主题，一个理论思维较强的人可以从事基础领域的研究工作。

二是外部环境因素。它包括已有研究基础是否扎实，自己能够有效使用的研究工具是否齐全，自己能够有效支配的科研经费的数量，是否需要以及能否组建有效科研团队，适合条件的被试是否充足，相关研究文献是否能够有效地收集与整理，单位工作量大小，家务量大小等。其中，后几个因素一看就明白，不多讲，只简要谈一下“已有研究基础是否扎实”这个因素。根据学术研究的常态是遵循“渐变”的原理，如果将某一主题现已取得的所有研究成就视作A1，将一个人对此主题将要开展的进一步研究所取得的预期研究成果比作A2，那么，“A2-A1”（即A2减A1）的结果就一定是一个正数，且这个正数的值不会太大。以微软公司推出的“Windows”系列产品为例，从Windows 95直到北京时间2014年10月1日发布的Windows 10，期间遵循的恰好就是“渐变”原理。张光鉴提出的“相似论”讲的也是这个道理。所以，假若你的预期成果太超前，致使现有研究成果无法为你的研究提供起码的研究基础，那么，在一般情况下，可以预测你的研究是很难取得成功的，这表明此主题暂时不适合去做，因为它的客观条件还不成熟。

③能否推陈出新。

某一研究主题即便很有学术价值，即便你已拥有了研究它的足够多的学术资源，仍不见得就适合你。此时，还必须看最后一个影响因素：你能否在此主题的研究上做到“推陈出新”？假若答案是肯定的，那就可以去做；如果答案是否定的，那就不能去做。因为学术研究贵在一个“新”字，所谓“一新遮百丑”。当然，“新”有多种，主要包括“选题新”（作者找到一个全新的研究主题）、“视角新”（它指用新视角来提出问题、审视问题或研究问题）、“论点新”（作者提出前人未见的新观点）、“方法/研究范式/实验设计/研究工具新”（作者使用与前人不一样的研究方法、研究范式、实验设计或研究工具；若能提出全新的科学研究方法、研究范式、实验设计，设计或研制出崭新的科研工具，或对原有方法、研究范式、实验设计或研究工具作大幅度的改善，那就属于上乘作品）、“论据新”（作者找到前人未发现或未发明的新证据）和“结构新”（作者用一个前人未用的结构来组织材料。从碳到钻石，只是结构不同，由此可见“结构新”的价值）等六大类。一篇文章或一部著作至少要具备这六个“新”中的一种，否则，就不值得作者去写或去研究，因为低水平的重复研究是科学研究的大忌。

（3）结论。

综合上述标准，若想找到一个适合自己研究的“好问题”，要从以下五个方面来努力：①杜绝盲目的“拿来主义”。管它适不适合中国国情，只要是外国同行尤其是美国心理学研究者曾关注的问题，就盲目将其拿来作为自己的研究选题，然后美其名曰“填补国内空白”，或者说“将之本土化”。殊不知，就心理学专业而言，有些外国学者关注的问题在中国并不算问题，至少不能算“主要问题”；而在中国存在的一些真真切切的问题，因在一些西方发达国家那里并不存在，或者即便存在，也不算“主要问题”，故西方发达国家的学者并不关注。若所研究问题脱离中国国情，自然不易得到高质量的研究成果。②避免“炒冷饭”。某些问题曾经是“好问题”，但经过一些学人的多角度研究，现已经取得了一些丰硕成果，导致该问题在可以预见的一段时间内无法再有实质性突破。对于此类现已被做透的老生常谈的问题，若后来者无法做出上述六种“新”中的一种，就应暂时将之搁置起来，等将来出现了新思路或新方法时再来研究。③不可随便“拉郎配”，即在没有任何文献基础或理论基础的背景下，硬要将A与B或A、B与C放在一起，然后研究它们之间的相关关系或中介关系。④慎自编问卷。这点在下文有详论，这里不多讲。⑤慎做纯粹的理论研究。对于多数硕士生或本科生而言，你们的理论思维尚处于发展阶段，没有真正成熟；同时，理论思维还需要研究者有丰富的人生阅历，进而对人生有深刻理解，多数硕士生和本科生显然也做不到。所以，初学者要放弃“理论好做，实验与统计难学”的偏见，慎做纯粹的理论研究。

从正面看，要努力坚持以下三种做法：第一，要善于结合当代中国国情，挑出一个既有理论意义更有现实意义的新主题去做。主题一新，自然容易出成果。第二，在方法上要多采用实验法，尤其要适当多做行为实验。第三，要多做小题目，“小题大做”往往更易操作，更易控制，更易深入，自然更易出成果。

2.形成并提出假设或假说

在科学研究中，了解到问题之后，研究者便会根据已知的科学事实和原理对它作出尝试性的或假设性的推测，从而形成科学假说。所谓科学假说，也叫“科学假设”或简称“假说”或“假设”（hypothesis），指依据已有的科学事实和原理以及新的科学事实，对所研究的问题作出的猜测性说明或尝试性解答。科学假说的基本特征是：科学性、猜测性（或叫“非确定性”）、可检验性。建立科学假说的原则是：解释性、对应性、合理性、可检验性。

一般而言，“假设”总是被描述为“如果……那么……”的形式，主要指特定结果是从特定条件中得来的。例如，假若你提出如下假设：“可以预期，如果儿童在电视中看了大量暴力的场面，那么，他们将对同伴表现出更多的攻击行为。”那么，接下来你的研究就是验证这个假设里的“如果”和“那么”之间的联系。

建立明确的科学假设的意义主要有三：第一，有助于将经验事实与科学理论联系起来。第二，能够帮助研究者理清自己的研究思路，因为假设的提出往往是研究者思路清晰的表现。第三，使科学研究带有自觉的性质。研究者要根据自己的假设，自觉地确定自己的研究方向，自觉地、有计划地进行新的观察、新的实验，发现新的事实。

至于提出假设的方法，根据推理所表现的思维进程的方向，可以分为演绎推理法、归纳推理法与类比推理法三种。演绎推理（deductive reasoning），有时也称演绎，与归纳推理相对。传统逻辑中指由一般性知识前推出个别性或特殊性知识的结论的推理，有三段论、关系推理、假言推理、选言推理等，但最主要的还是三段论。演绎推理的前提和结论间具有蕴含关系，因而演绎推理是必然性推理。归纳推理（inductive reasoning），也称归纳法，与演绎推理相对，指从个别性知识的前提推出一般性知识的结论的推理。归纳推理的结论一般超出了前提陈述的范围，故当前提真时，结论并不必然真。归纳推理分为完全归纳推理和不完全归纳推理两类。类比推理，也叫“类比法”，即根据两个或两类对象的某些属性的相同，推出它们的其他属性也可能相同的推理。类比推理是依照下述方式进行的：

A 对象具有属性a、b、c、d

B 对象具有属性a、b、c

所以，B对象也具有属性d

上式中，“A”和“B”可指两个类；也可以指两个个体；还可以其中一个指类，另一个指个体。换言之，类比推理可以在类与个体之间应用。如：荷兰物理学家惠更斯（Christian Huygens,1629—1695）曾运用类比推理提出了光波的概念。光和声这两类现象具有一系列的相同性质：直线传播，有反射、折射和干扰的现象；而声波有波动性质，他由此推出结论：“光可能有波动性质。”

类比推理具有四个特点：第一，它离不开形象。它是形象的同位移植，而不是概念的横向铺展。第二，它以经验而非概念为基础，是在已有经验的基础上类推出关于未知事物的认识。第三，它的推理过程是叠合性、跳跃性的，不是环环相扣、严密无缝的。第四，类比推理既包含由特殊到特殊，也包含从一般到一般的推理。所以，类比推理是一种或然性推理。类比的结论之所以具有或然性，主要原因有二：其一，两个对象之间不仅具有相同性，而且具有差异性。换言之，A、B两对象虽然在一系列属性（a、b、c）上是相似的，但由于它们是不同的两个对象，总还有某些属性是不同的。如果d属性恰好是A对象异于B对象的特殊性，那么作出B对象也具有d属性的结论，便是错误的。其二，对象中并存的许多属性，有些是对象的固有属性，有些是对象的偶有属性。如果作出类推的d属性是某一对象的偶有属性，那么另一对象很可能就不具有d属性。因此，类比推理的可靠程度取决于：前提中确认的共同属性的多少以及共同属性和类推出来的属性的关系是否密切。

类比推理虽有模糊性与或然性，缺乏精确性和必然性，但并不意味着它就完全不具科学性。不精确与不科学是两个不同的概念，现代物理学有“测不准原理”，现代数学也有模糊数学，它们都是十足的科学。并且，类比推理在现代科学中早已得到广泛运用：仿生学就是运用类比推理形成的，现代人所熟悉的飞机、电脑也是从鸟的飞行和人的大脑向外类推的产物。

有思想的研究者往往以一种独特的手段来组合已有的思想，以提出创新的观点。真正有创造力的思想者的标志是发现一个新的真理，它可以朝着更好的方向推进科学和社会的发展。

（二）设计研究方案，进行验证，得出结论

假设的真伪需要验证。建立假设之后，下一步便是要提出具体可行的研究设计：如何确定可选择的被试和研究工具；如何界定研究变量，并对假设中的概念下操作性定义。一个操作性定义阐明用以代表一个概念的确切程序。例如，你可以将挫折定义为“在一个人即将解出一道难题并赢得10 000元人民币之前打断他”。操作性定义使假设中的概念具体化，从而以事实资料来验证假设。如果不下操作性定义，就无法进行实际的研究；即便是研究了，这样的研究报告也不能为他人所接受。为了有效地验证假设，研究者还必须根据假设选择合适的研究方法，使被探讨的问题得到有效的观测。研究设计是根据假设作出的，研究者搜集的资料应当尽量直接与假设有关。但是，研究者的思想却不能受固定的思想所束缚，不能以先入之见，只搜集预期的资料而忽略其他意外的资料。

在大多数情况下，研究者进行的工作是从发现到检验假设。验证的背景（context of justification）是把证据拿来验证假设的研究阶段。当试图得到可以产生有效结论、令人信服的证据时，教育心理学家面临严峻的挑战。他们依赖一个同盟者——科学的方法（scientific method），它使成功成为可能。科学的方法是通过将错误降低到最小，提出可靠的归纳等方法来收集和解释证据的一般程序的集合。心理学（包括教育心理学）被认为是一门在某种程度上遵循科学方法去建立规则的学科。

因为在科学研究的数据的收集和分析阶段中，主观性必须被降低到最小，人们用程序的保障措施来增加客观性。其中一种保障措施不言自明：那就是研究者必须以一种别的研究者可以理解和评估的形式来保存数据分析时所观察到的完整记录。

科学研究的下一步是采用适当的方法将搜集到的原始资料加以整理、分类，使之系统化和简约化。在教育心理学研究中，对于资料的分析通常是使用各种统计方法。统计分析的主要作用有二：一是简化原始资料，以便把握资料分布的情况；二是检验各类资料的关系以及关系的程度。所以，在分析资料时必须借助统计方法和理论思维。就某一项教育心理学研究来说，其最后的阶段是作出结论。在作结论时必须根据事实资料，而不能凭空臆测。通过研究设计、统计分析、作出结论，就可以对研究初期提出的假设进行检验。如果假设得到了验证，这个假设的可信度便提高了。

应当注意，在教育心理学研究中，由于种种原因（如研究现象的复杂性和指导思想上的问题）往往会出现虚假的实验验证。心理学假设的验证不是一次性的，而是要不断重复的。能重复验证的假设便具有科学价值，有可能发展成为某种心理学的理论；如果假设得不到验证，则这个假设就被否定。

上述步骤是密切联系的，无论哪一个步骤有错误都将导致研究的失败。

二、两种研究类型与两类研究方法

（一）教育心理学的两种基本研究类型

决定论（determinism）是所有学科研究的出发点，进行任何科学研究之前首先都必须假设“万事万物之间都有一定的规律或法则可循”。犹如一个人去河塘钓鱼，事先要假定此河塘有鱼，否则必不会去此河塘钓鱼。科学研究也是如此。科学家必须假定事物之间有一定的法则或规律，因为只有这样的事物才值得去探索或研究，否则科学研究就无所适从。概要而言，事物间的规律可以分为两大类，相应地，教育心理学的研究主要有两种基本类型：相关关系与相关研究以及因果关系与因果研究。

1.相关关系与相关研究

相关关系（correlation relationship）是事物与事物之间的一种重要关系。如果两个事物之间存在共变关系（covariation relationship），便存在相关关系。所谓“共变”，是指一个事物发生变化时，另一个事物也发生相应的变化。例如，身高与体重之间有相关关系。身高者，通常体重也重；身矮者，通常体重也较轻。身高与体重之间存在共变的现象，表示二者之间有相关关系。假若一个事物（如身高）发生了变化，另一个事物（如智慧）保持不变，那么这二者之间就没有共变的相关关系。

教育心理学中有一些研究就是要力图揭示出心理现象的相关关系，这类研究一般叫相关研究。当力图分析两个变量、特质或者属性关联到什么程度时，教育心理学家就使用相关的方法（correlational methods）进行研究。为了确定存在于两个变量之间相关的精确程度，教育心理学家需要计算一个名为相关系数（correlation coefficient)(r）的统计量。这个值在1.0到-1.0之间变化，其中1.0表示完全正相关，-1.0表示完全负相关，而0表示根本没有相关。一个正的相关系数意味着当一列分数增加时，第二列分数也增加；负相关正好相反，第二列分数和第一列分数朝相反的方向变化。一个非常接近于零的相关意味着两个测量分数之间存在很弱的联系，或是根本不存在联系；当相关系数越来越大，至接近于最大值1.0的时候，根据一个变量的信息来预测另一个变量的可能性就越大。

高的相关只是表明两列数据以一种系统的方式建立了联系，并不意味着一个事件可以导致另一个事件的发生，并不意味着因果关系。事实上，相关可能反映一部分因果关系，也可能根本就不反映因果关系。例如，假若学习压力和学习效率之间存在负相关，那么，这种负相关可能意味着：①学习压力从根本上是人们学习效率低下的原因；②不佳的学习效率使人们承受了更大的学习压力；③存在一种特定的人格类型，他们更可能承受学习压力，同时也在学习中表现不佳。注意最后一种情况，第三方变量影响到其他两个变量的变化。请想象最后一种情境，假设教室周边存在很大的噪音，噪音导致了更大的学习压力（因为学生预计到高噪音将降低自己的学习成绩，由此可能导致家长或老师的批评），也导致了学习效率的下降（因为学生无法有效集中精力来学习）。此时，相关依然存在——高的学习压力和低的学习效率同时发生——但这根本就不是因果关系。

相关也可能是伪造的，因为研究者不能通过恰当的控制来进行比较。但我们并不想给你留下这样的印象，即相关的方法不是一个有价值的科研工具。

2.因果关系与因果研究

因果关系（cause-effect relationship）是事物与事物之间的另一种重要关系。通过研究，如果可以清楚地指出一种事物是因，另一种事物是果，那么，这两种事物之间就存在因果关系。例如，闪电与打雷之间就存在因果关系：闪电是因，打雷是果。凡构成因果关系，总是因在前，果在后，这种顺序是不会改变的。

教育心理学中有许多研究就是要力图揭示出心理现象的因果关系。在进行因果研究时，研究者一般要做到：一是要创设某种实验情景，使之能引起某种心理现象，同时要控制可能影响这种心理现象的其他因素。正因为如此，因果研究一般都是实验研究。二是当一种情景引起了某种心理现象时，只能说在这种实验情景下，前者是因，后者是果，脱离一定条件来讲因果关系是没有什么意义的。

3.相关关系与因果关系的联系与区别

相关关系与因果关系的联系是：两个事物之间如果具有因果关系，就必定具有相关关系；但是，两个事物之间有相关关系，并不表示它们之间就必定具有因果关系。在这个角度上说，因果关系只是一种特殊的相关关系。

相关关系与因果关系的区别是：事物出现的先后顺序是否重要。具有因果关系的事物，因的事物必须出现在果的事物之前，果必在因之后。这种因果先后顺序是因果关系的显著特点。然而，对于相关关系则不必考虑先后顺序的问题。

4.相关研究与因果研究的差别

任何两个事物之间要么是相关关系，要么是没有关系（如人的年龄与太阳黑子之间就无任何相关）。通过相关研究，一旦肯定两个事物之间有相关关系，就可以肯定它们彼此影响，但不能确定这种影响是由谁引起的，即不能确定谁为自变量谁为因变量。若要达到后一个目的，只有通过实验研究（先要进行实验设计，其基本思想是使自变量和因变量之间达到一因一果的关系，这样，才可由因推果，由果及因）求其因果关系。因此，因果研究与相关研究之间的主要区别在于：前者目的在于寻求或确定变项之间是否存在因果关系，因果关系一旦确定，就能指出何者为自变量何者为因变量；后者目的在于寻求或确定变项之间是否存在相关关系，相关关系一旦确定，就可以肯定存在相关关系的两个或两个以上变项之间有关系（而不是没有关系），只是不能确定有关系的变项之间何者为自变量何者为因变量。如鸡生蛋、蛋生鸡问题，肯定是一个有相关关系的问题，但却不能确定何者为自变量何者为因变量，故不能确定其因果关系。

（二）教育心理学的两类研究方法

1.量的研究方法

“量的研究”（quantitative research），指一种对事物可以量化的部分进行测量与分析，以检验研究者提出的有关理论假设的研究方法。量的研究有一套相对较成熟的操作技术，包括抽样方法（如随机抽样、分层抽样、系统抽样、整群抽样等）、资料收集方法（如实验法、测量法和问卷法等）、数字统计方法（如描述性统计与推断性统计等），正是通过这种测量、统计与分析，以求达到对研究对象的“本质性规律”的认识。稍有心理学常识的人都知道美国心理学家桑代克于1918年说的“凡是存在之物皆有数量”，由此可见，量的研究方法的应用范围极广。直到现在，主流心理学（包括教育心理学）都崇尚实证主义，强调研究的客观性和验证性，喜欢用数字表示结果，因而都可称作量的研究或实证研究，这是心理科学研究的传统方法。

实证肯定重要，不过，可靠的“知识”（广义的）并不是全都必须依据于实证，逻辑推理（有时候，甚至直觉判断）也能为人们提供可靠的“结论”。假若过于重视实证，强调在任何学术领域里，一种观点或一个结论是否可靠，关键是看其有无可靠的“证据”，这样做就会闹出“趣闻”乃至“笑话”。如受实证思想影响的顾颉刚，在他的老师章太炎面前大讲实证，导致章太炎不快。章太炎于是问顾颉刚见没见过自己的祖父，顾说没有。章太炎马上反问顾，难道你的祖父就不存在吗？

2.质的研究方法

“质的研究”（qualitative research），指研究者通过与被研究者之间的互动，对研究对象进行长期深入细致的体验，然后对研究对象的“质”作出一种较整体性的、解释性的理解与阐述的研究方法。“质”实际上指的是该事物的“性质”“属性”和“特质”，是该事物用以区别于其他事物的特征和组成部分，包括该事物中可以“量”化的特征和组成部分。需指出，这里讲的“质”，与“本质”有一定的区别。“本质”是相对于“现象”而言的，来源于自柏拉图始到笛卡尔集大成的二元认识论。这种“主—客”对立的思维方式认为，人们日常看到的东西只是事物的现象（或表象），一定要通过深入的分析（或通过实证的、可以感知的资料，或通过概念的、逻辑的哲学辨析），才能够获得对事物表象下面“本质”的了解。而质的研究由于受到现象学的影响，认为现象本身就是本质，现象学强调对事物本质的直观体验，在变动不居的意识流中去把握事物稳定的、常住不变的状态。这样，质的研究不认为现象与本质、形式和内容之间是可以分离的。事物（或意义）就像是一个洋葱（与二元论的核桃模式相对立），其本质和现象实为一体，如果对其进行分解，一瓣一瓣地剥到最后便什么也不存在了。在质的研究中，重要的不是“透过现象看本质”，而是通过现象本身再现现象本身的“质”。质的研究常用以下四种方法：一是个案研究（case study），二是参与观察（participant observation），三是深入访谈（depth interview），四是文本分析（document analysis）。

3.量的研究与质的研究的比较

从表面上看，在研究目的上，质的研究与量的研究有很大的相通之处：二者都是试图从问题现象入手，找出变项之间的因果关系或相关关系。这样，在基本方式上，质的研究其实也包括实验研究和相关研究。质的研究与量的研究不同的地方只在于：质的研究除了改用语文表达研究结果外，研究者在进行研究时，更希望能从被研究者的反应中获得更详细、深入、具意义的资料（包括被研究者的个人意见与主观感受等）。若进一步分析，这两种研究方式有很大的不同，可以用表1-1进行简要概括。

表1-1 量的研究与质的研究的主要差别

（续上表）

4.对量的研究与质的研究的超越

“量的研究”与“质的研究”是在典型的西方“二分式”思维方式影响下的产物，既易造成两种研究方式或方法的对立，更易让人割裂量与质之间的辩证关系。从唯物辩证法的角度看，量中有质，质中有量，二者无法截然分开。一项高质量的学术研究既要研究事物的量，更要揭示事物的质。所以，研究者不必在“量的研究”与“质的研究”上纠缠，而应根据研究对象的特点，灵活采用适当的研究方法。一项学术研究只要遵循规范的研究程序和严密的逻辑推理（当然研究者也可凭借自己深刻的洞察力以直觉的方式直接把握事物的规律），呈现充足的证据，经细致讨论后得出新颖、有价值且可靠的结论，就都属高质量的研究。

三、科学选择具体的研究方法

冯特曾说：“科学的进展是同研究方法上的进展密切相关联的。近年来，整个自然科学的起源都来自方法学上的革命。” 此观点同样适用于研究教育心理学。在中国，研究教育心理学的方法系统可以用“一导多元”四个字加以概括。“一导”指以辩证唯物主义和历史唯物主义为指导，“多元”指研究视角、基本研究原则和具体研究方法应多样化。简要地说，在研究视角上，心理学家主张坚持“大心理学观”的研究视角，消除“小心理学观”研究视角给教育心理学发展带来的消极影响。在基本研究原则上，主张坚持客观性原则、系统性原则、发展性原则、文化性原则和理论联系实际的原则等。在具体研究方法上，主张依研究对象的具体情况，灵活采用观察法、实验法、问卷法、测验法、语义分析法、深度比较法和推理法等多种方法。同时，心理学家清楚地认识到，即便出自最“权威”之口的观点也可能是错误的。这样，心理学特别看重证据（empirical evidence），即那些通过直接观察和测量得到的信息。只要有可能收集到数据（data），心理学家就会用那些观察事实来解决学术上的争论，因为数据可以使人们能够比较观察到的事实，得出精确的结论。在上述方法系统中，指导思想、研究视角与研究原则大家多很熟悉，下面只详论具体研究方法。

（一）观察法

1.什么是观察法

人们在自然条件下对表现心理现象的外部活动进行有目的、有计划、有系统的观察，作出详细记录，然后进行分析处理，从中发现被试心理与行为的规律，这种方法叫观察法（observation method）或自然观察法。在一项研究的初期，自然观察法特别有用，因为它有助于研究者发现某一现象的范围，或发现一些重要变量以及变量间的关系。通过自然观察法得到的数据可以为研究者提供线索，这有助于明确表达假设或研究计划。观察法可以分为不同的类型：

（1）参与性观察与非参与性观察。

参与性观察是指研究者以参与者的身份进行的观察。在参与性观察中，研究者全程参与，往往能够对被观察者的心理与行为有一个切身的体验，从而易观察到被观察者的真实心理与行为；不过，参与性观察也易犯“不识庐山真面目，只缘身在此山中”的错误。非参与性观察也叫局外观察，是指研究者以旁观者身份进行的观察。在非参与性观察中，研究者往往只是一个旁观者，这样易对观察对象进行客观的观察；不过，这种方法也因研究者未深入或不易深入到被观察者的真实生活情境中，而易得出失真的结论。

（2）公开观察与隐蔽观察。

公开观察指研究者在征得被观察者同意之后，以公开身份进行的观察。公开观察因研究者事先已得到被观察者的授权，一般不易发生可能因有违伦理道德而引起的纠纷；不过，因观察对象知道自己的言行处在被人观察的状态中，由于“紧张”“投观察者所好”或“不愿暴露自己的隐私”等心理的干扰，易导致观察对象展现失真的言行，从而致使观察者收集失真的资料。隐蔽观察指研究者在观察对象不知情的情况下对观察对象进行的观察。隐蔽观察因观察对象不知道自己的言行正在被人观察，其所展现的言行往往颇为真实，从而可让观察者收集到客观、准确的资料；不过，隐蔽观察因研究者未得到被观察者的同意或授权，一般易发生可能因有违伦理道德而引起的纠纷。

（3）实验室观察与自然观察。

实验室观察主要是在有各种观察设施的实验室或是经过一定布置的活动室等场所内，研究者按照预先设计的观察目的与要求对研究对象进行的观察。它常常用于了解个体某些具体、细微的行为特征，观察所得到的数据常可以进行定量分析。实验室观察的优点是能高效收集到相关研究资料，缺点是可能会因实验情境而导致观察对象产生失真行为。自然观察主要是研究者根据研究的需要，采取参与、半参与或是非参与的方式，在自然环境中或是在现实的生活场景中，对观察对象进行实地的观察。自然观察的优缺点在下文“观察法的优缺点”里有详论，这里不多讲。

2.观察法的适用条件

观察法一般在下列情况下使用：①对所研究的对象无法加以控制；②在控制条件下可能影响某种行为的出现；③由于社会道德的要求，不能对某种现象进行控制；④当被试的言语表达能力不佳（如婴幼儿）或有言语障碍（如哑巴）时。同时，一般而言，观察法不适合如下情况：①在面上对研究对象进行大规模的宏观调查；②对过去的事情、外域社会现象以及隐秘的私人生活进行调查；③了解被研究者的思想观念、语词概念和意义解释；④对心理现象进行因果分析。

3.观察法的研究程序

（1）确定观察目的及内容。

研究者事先必须明确“要观察什么”，即通过观察收集而来的资料拟解决或验证什么样的研究假设。目标行为被确定后，还必须给出一个清晰和准确的操作性定义，以便进行客观记录和评价。操作性定义（operational definition）这个概念最早由物理学家布瑞格曼（Bridgman）提出。布瑞格曼主张，科学上的概念或术语，为了避免含糊不清的缺陷，最好能以我们“所采用的测量它的操作方法”来界定，它可弥补概念性定义（conceptualdefinition，指用抽象性描述而不用“我们所采用的测量它的操作方法”来界定概念的内涵的方式）的不足。如，若将智力定义为“抽象思维的能力”，这是概念性的定义；若将智力定义为“根据比纳量表或韦氏量表所商量得的分数”，就变成操作性定义了。可见，在给概念下操作性定义时，必须用可观察和可测量的术语加以表述，以便保证定义清晰，只是在此过程中不能涉及任何内部状态，不能对个人意图作主观推测。“可观察”意味着这个行为是外显的，观察者可以直接看到这个行为的出现、维持、变化和结束。“可测量”意味着观察者可以对这个行为的出现频率、持续时间、强度或其他维度给出数量化的评定。“定义清晰”意味着这个定义是不含糊的、容易理解的，不同的人看到这个定义后，都能够观察到同一个行为，并对这个行为是否已经发生判断一致。

观察内容指在观察中要了解什么情况，收集哪些方面的事实材料，从哪些方面进行观察记录等。这可以根据观察目的的操作性定义进一步加以细化，确定观察的项目，设计出观察内容表格。实践表明，一个好的观察内容应该具备两点：一是能准确地反映、体现或说明观察目的，二是可以被观察到。

（2）制订观察计划。

制订具体的观察计划，主要包括观察日程、观察人员、辅助人员、观察工具、观察场地安排（或实验室布置）、观察对象及人数、观察与记录的方式、观察的次数、观察的密度、每次观察持续的时间、观察记录表格及其使用的代码符号以及观察应特别注意的问题等。同时，观察提纲至少应该回答下面九个方面的问题（Goetz&LeCompte,1984）：①谁？（谁在场？他们是什么人？他们的角色、地位是什么？有多少人在场？这是一个什么样的群体？在场的这些人在群体中各自扮演什么角色？谁是群体的负责人？谁是追随者？）②什么？（发生了什么事情？在场的人有什么行为表现？他们说/做了什么？他们说话/做事时使用了什么样的语调和形体动作？他们相互之间的互动是怎么开始的？哪些行为是日常生活中的常规？哪些是特殊表现？不同参与者之间在行为上有什么差异？他们的行为是如何产生和发展的？有关人员对此有什么看法？有关人员的目的、动机和态度是什么？）③何时？（有关行为或事件是什么时候发生的？持续了多久？频率如何？）④何地？（有关行为或事件是在哪里发生的？这个地点有什么特色？）⑤如何？（有关事情是如何发生的？事情的各个方面之间存在什么样的关系？有什么明显的规范或运作机制？）⑥为什么？（促使事件发生的原因是什么？）很显然，这些问题需要通过一定的推导，不能指望全部通过外部观察就可解决。当然，参与型观察不排除现场询问的方式，因此也可以通过这类方式获得当事人的想法。⑦信度：观察中可能出现哪些影响信度的问题？我打算如何处理这些问题？我计划采取什么措施获得比较准确的观察资料？⑧效度：观察中可能出现哪些影响效度的问题？我打算如何处理这些问题？我计划采取什么措施获得较准确描述问题的观察资料？⑨伦理道德问题：观察中可能出现哪些伦理道德问题？我打算如何处理这些问题？我如何使自己的研究尽量不影响被观察者的生活？如果需要的话，我可以如何帮助他们解决生活中的困难？这样做对我的研究会有什么影响？

（3）实施观察并做好记录工作。

观察者按照在观察研究设计中制定的程序进入观察情境，采用事先选择好的观察类型和技术手段进行观察，并把观察到的资料记录下来。在观察过程中，记录是至关重要的一个环节，记录是否全面、准确，直接关系到观察法所收集资料的价值。因此，在正式开始观察之前，必须重视做好记录准备工作。一般包括两种情况的准备：一种是记录表格；另一种是准备好记录用的仪器设备，如录音机、照相机、摄像机等。

（4）分析资料和呈现结果。

为了尽量保持准确和客观，最好在观察记录的同时或当天进行初步数据分析，一周左右对收集到的观察资料作出结论和推论，并将其以报告的形式呈现出来。根据观察结果是否可以作量化处理，可以将其区分为定性资料与定量资料：对定性资料的分析，不仅要揭示其结果表示的“意义”，而且还要注重对事件过程的分析，而对定量资料的分析则可以根据研究假设，对它们进行相应的统计分析。

4.观察法的优缺点

观察法的长处主要有三：①对被观察者的行为进行直接的了解，所以能收集到第一手资料，并且，不仅可以记录到被观察者的言语行为，还可以清晰地观察到被观察者的非言语行为。②自然观察法因是在自然条件下进行的，被观察者的心理与行为较少或没有受到“环境的干扰”，这样，有可能了解到被观察者的真实心理与行为状况。例如，通过单向玻璃，研究者能观察儿童游戏，而儿童并没有察觉到被观察。人类的一些行为只有通过自然观察才能进行研究，因为在非自然条件下研究是不道德的或不切实际的。例如，研究生命早期的严重剥夺对儿童后期发展影响的实验就是不道德的。③在塑造复杂的行为模式中物种的自然栖息地所具有的长时效应，在实验室的人为环境中是观察不到的。

观察法的缺陷主要有四：①在自然条件下，事件较难按完全相同的方式重复出现，这样，难以对某种现象进行重复观察，观察的结果也较难进行检验与证实，其研究结论的信度自然受到一定的限制；②在自然条件下，影响某种心理活动的因素是多方面的，用观察法得到的结果往往难以进行精确的分析；③由于未对条件加以控制，这就使得观察者不能主动地控制或改变环境变量以引发所要研究的行为，结果，观察者经常只能处于消极等待的被动地位，观察时可能出现不需要研究的现象，而要研究的现象又可能没有出现，例如，研究儿童的攻击行为时，可能等好几天也看不到真正的儿童打架事件；④观察容易“各取所需”，观察的结果容易受到观察者本人的兴趣、愿望、知识经验和观察技能的影响。

5.观察法在使用过程中常见的问题及对策

第一，不按规范程序使用观察法，导致通过观察所得数据呈现出随机、零散等缺陷，基于此类数据自然无法得到可靠结论。既然如此，一定要按上文所讲的规范程序科学使用观察法。

第二，观而不察，察而不思。“观而不察”中的“观”指无目的地、泛泛地看。由于仅有这种“观”，往往对很多现象熟视无睹，结果自然无法收集到大量有价值的数据（data）。例如，一个每天要爬楼梯回家的人，由于对楼梯只观不察，你要问他楼梯的层级，他一定无法准确回答。“观而不察”中的“察”指有目的且细致深刻地看。只有认真去“察”，才能获得大量有用数据。不过，在收集到丰富的有用数据后，若不善于思考，仍不会得到高质量的成果。既然如此，在运用观察法时，先要有目的且细致深刻地去看；在此基础上，再对所获数据进行认真思考。

第三，缺乏足够的专业知识。有一些人在使用观察法时，尽管知道睁大双眼仔细去看，但由于脑海中缺乏足够的专业知识，仍然收集不到有用的数据。犹如一个对玉一窍不通的人去买玉，虽然知道要仔细看，但仍无法分辨玉的质量高低，故容易上当。因此，平日一定要加强“内功”的修炼，丰富自己的专业知识。

（二）实验法

1.什么是实验法

实验法（experimental methods），也叫“试验法”或“科学实验法”，指根据一定目的，运用必要的手段（如运用一定的仪器、设备等物质手段），在人工控制的条件下，观察、研究自然现象及其规律性的社会实践形式。通常包括现场实验和实验室实验两种方法。在教育心理学领域，以现场实验法为主。现场实验法是指研究者为了解决某一问题，根据一定的心理学和教育学理论，在严格控制或特别创设的条件下，在教育或学习现场有目的、有计划地观察、记录、测定教育者与受教育者心理与行为的变化，研究教育条件与教育者和受教育者心理和行为之间的因果关系，从而得出科学结论的研究方法。实验法的目的是确定各变量间的因果关系，主要涉及三类变量：

一是“自变量”（independent variable）。自变量一词来自数学。在数学中，y=f(x）。在此方程中，自变量是x，因变量是y。将这个方程运用到心理学研究中，自变量也叫实验变量，指由实验者操纵的变量。自变量的大小、范围或取值一般通过文献综述、理论建构或预实验等方法来确定，由实验者操作。自变量被认为是引起行为差异的可能原因。自变量有连续变量和类别变量之分。如果实验者操纵的自变量是连续变量，则实验是函数型实验；如果实验者操纵的自变量是类别变量，则实验是因素型实验。自变量的类型多种多样，可以概括为四大类：①刺激特点自变量：假若被试的不同反应是由刺激本身的不同特性，如灯光的强度、声音的大小等引起的，就把引起因变量变化的这类自变量称为刺激特点自变量。②环境特点自变量：进行实验时环境的各种特点，如温度、是否有观众在场、是否有噪音、白天或夜晚等，都可以作为自变量。时间是一种非常重要和无时不在的自变量，特别是在记忆的实验中，你甚至可以说，几乎没有不用时间作自变量的记忆实验。③被试特点自变量：一个人的各种特点，如年龄、性别、职业、文化程度、内外倾个性特征、左手或右手为利手、自我评价高或低等，都可以作为自变量。④暂时造成的被试差别：被试的暂时差别通常是由于主试的安排，也就是由于主试给予的不同指示语造成的。

二是“因变量”（dependent variable）。由实验变量引起的某种特定的反应称为因变量（也叫反应变量）。这类变量的实验结果揭示自变量对行为的作用，而这种作用往往是通过诸如测验分数之类的操作成绩来表现的。一般而言，可以从两个方面对因变量进行分类：①客观指标：包括反应速度、反应速度的差异、反应的正确性、反应标准与反应的难度等。②主观指标：主要指被试的口语记录（protocol）。

三是“无关变量”（extraneous variable）。除实验变量之外，一切能够影响因变量的条件和因素都被称作无关变量（也称控制变量）。无关变量也常常引起因变量的变化，但在有些研究中是实验者希望排除的一些条件，实验者常常将其排除以使实验结果不受影响。

在心理实验中，出于经济性原则，研究者一般都会操作一个或一个以上自变量来观察其在因变量上产生的效果，这意味着研究者可以积极干预被试的活动，创设某种条件使某种心理现象得以产生并重复出现。这是它与观察法的不同之处。实验法的目的在于明确一种强烈的因果关系，即一个变量对另一个变量的影响。在实验中，实验组（experimental group）被试接受自变量条件，控制组（control group）被试接受除自变量条件以外的所有其他条件，然后比较这两个组的反应以确定自变量的效果。

2.实验法的研究程序

（1）实验课题的确定。

选择课题是科学研究的第一步，研究课题的来源通常有四个：①实际需要。从实际的工作中发现需要用实验研究来解决的问题。②理论需要。从理论或学说中推演出某个假设是否符合实际。③个人经验。针对在个人学习、工作和日常生活中的实际问题设计出种种实验。④前人的研究与文献资料。阅读文献可以发现什么问题已经解决、什么问题尚待研究。

确定研究课题后，应当明确研究目的和假设，理清研究思路。研究目的或假设的性质不同，直接影响着被试的选择、研究变量的确定、收集资料的具体方法与具体实验的设计方式。例如，“中学生阅读策略训练的干预研究”和“问题链设计的教学策略对提高小学生阅读能力的干预研究”两个课题，由于研究目的不同，其在研究变量与指标选择、被试选择等方面也就不同。在此特别值得一提的是，实验假设是关于条件和行为之间的关系的陈述，一般来说，假设应包括这样的内容：回答该实验的实际问题，对已知事实作出解释，并且能预言一些可被证实的观察。如果把对条件的叙述记为a，把对行为的叙述记为b一，般取“如果a，那么b”这样的形式。这些内容在前文已有阐述，这里不多讲。

（2）实验设计的情况。

实验设计是影响实验研究结果与结论的重要条件，它对实验可能涉及的各方面因素进行系统分析、筹划和安排，以保证后续实验的顺利进行和实现实验研究目的。它包括三个方面的问题：变量（variable）的分析与处理、被试的选择与分配、实验设计模式的选择，即怎样选择合适的样本及合适样本量的大小；怎样操纵自变量以获得可观察的因变量；怎样控制无关变量且减少测量误差，从而以最为合理、最为有效的方式达到预定的研究目标等。其中，实验设计是指通过操纵某些变量，对各实验组进行比较，产生有关的因果关系，主要包括随机、重复与混合三种基本的实验设计模式。目前，随着现代应用数学的发展，某些数学方法应用于心理实验设计已显示出普遍的实用价值，如完全随机化设计、随机化区组设计、多因素实验设计等已成为心理实验设计的重要依据。在教育心理学中，准实验设计更是常见的实验设计模式，即指未对自变量实施充分控制，但使用真正实验的某些方法搜集、整理以及统计分析数据的研究方法。准实验设计使研究者能够在道德和能力的限制范围内尽可能地关注感兴趣的问题，例如，研究者出于伦理考虑，不可能为观察大学生药物使用情况而创造一个药物滥用组，然后比较他们与我们创造的非药物滥用组的行为；又如，研究者也没有能力为了解自然灾害下的情绪反应而人为地制造一场地震。在这些情况下，严格的实验研究是不可能的，采用准实验设计能够在严格实验无法进行的时候取得结果。此外，实验设计还有许多具体的工艺和技术问题，巧妙的工艺和技术设计不仅能把心理学原理化于其中，而且可以在最有利的条件下准确地获取心理事实。

为了保证实验研究结果的可靠性，在实验设计时必须运用控制程序（control procedures）——它是一些力图使所有变量和条件（除了那些与被验证的假设相关的）保持恒定的方法——和双盲控制等手段来消除期望效应和安慰剂效应。因此，在一个实验中，指导语、室内温度、任务、研究者行动的方式、时间的安排、记录反应的方式，以及其他一些情境中的细节必须对所有被试都一致，以确保实验是相同的。被试所经历的唯一不同应该是那些自变量的不同条件。同时，在最理想的情况下，可以通过保证实验助手和被试都不知道（双盲）哪一名被试进行了哪项处理的方式来消除偏见。这一技术被称为双盲控制（double-blind control），它可以被用来消除实验者效应和安慰剂效应（placebo effect）。

所谓实验者效应，也叫霍桑效应，是指实验者为搜集能证明其假设成立的实验结果，在实验中有意或无意地通过不同的表情、语言或动作等将预期的要求暗示给被试，并因此引导被试生出期望的反应，造成一种实验结果有利于证明其假设成立的效应。在这种情况下，真正诱发被试作出相应反应的是实验者的预期，而不是自变量，结果就产生了实验者效应。

在心理学中，安慰剂效应是指当没有任何一种实验操作时，参加实验的被试也改变了他们的行为。安慰剂效应这一概念来源于医学中的一种现象：当病人接受了化学上无效的药物或无针对性的治疗后，他的身体却康复了。因此，在医学上，安慰剂效应是指由于个体对于治疗会产生良好效果的信念所导致的健康程度的提高。安慰剂（placebo）是一种假的药丸或针剂，它的作用来自给人的暗示，而不是来自真实的成分。糖丸和生理盐水注射液是常用的安慰剂。一些采用无疗效药物的治疗已经表明，在安慰剂效应的影响下，有70%采用过这种药物的病人都有好的或极好的结果（Robert et al.,1993）。安慰剂效应是以期望为基础的，并不是完全的想象。在心理学的研究情境中，当行为反应受到个人对做什么和如何感受的预期的影响，而不受特定的介入或产生某种反应程序的影响时，安慰剂效应就出现了。

顺便指出，在心理学实验中还要努力避免天花板效应（ceiling effect）和地板效应（floor effect），因为天花板效应和地板效应都阻碍了因变量对自变量效果的准确反映。所谓天花板效应，是指反应指标的量程不够大，导致因变量水平趋于完美（接近于量表的“天花板”），造成反应停留在指标量表的最顶端，使指标的有效性遭受损失；所谓地板效应，是指反应指标的量程不够大，导致因变量水平趋于零效应（接近于量表的“地板”），造成反应停留在指标量表的最底端，使指标的有效性遭受损失。该怎样避免天花板效应和地板效应呢？常用方法是先通过实验设计去避免极端的反应，然后再通过测试少量的先期被试来考察他们对任务操作的反应情况。假若被试的反应接近指标量程的顶端或底端，那么实验任务就需修正。例如，在一个练习实验中，假若练习成绩太好，就可以增加练习难度以降低练习成绩；与此相似，如果被试完成得太糟糕，几乎无法完成练习，就要通过延长练习时间、减少练习量等方法降低练习难度。设计实验任务和反应指标的指导思想是应使被试的反应情况分布在指标量程的中等范围内。这样，操作自变量时，被试反应水平的提高或降低都能被观察到。谨慎的研究者在实施可能被天花板或地板效应污染的实验前，会先做好预备实验。预备实验能使研究者了解到实验中存在的有关设计或实验程序方面的问题。可见，了解天花板效应、地板效应及相应的回避方法，有助于更好地构思实验设计、更好地开展实验以及更好地对实验结果进行解释与讨论。

（3）实验计划的制订与实验材料的准备。

制订实验计划应注意两点：一是计划要周全、有序。如实验的全过程大体可分为哪几个阶段，每一阶段要解决什么问题，达到什么目的，安排哪些工作，每一阶段大致需要多长时间；采取哪些具体措施去保证各阶段工作的正常进行，以实现预期目标；哪些工作可由个人承担，哪些则必须共同协作集体攻关，个人进行的工作又如何分配力量和时间，集体合作的工作又如何体现既分工又协作的原则等。二是选择合适有效的实验物质手段，这主要包括实验场所、实验仪器、实验所需要的设备与材料等。实验研究是探索未知的领域；如要解决特殊问题，获得具有创造性的成果，仅仅利用已有设备是不够的。因此，凡是心理学上有所建树者，其研究业绩的树立往往与他们自觉改进、设计、研制实验装置分不开，如斯金纳设计的“斯金纳箱”等。同时，对于教育心理学领域的实验尤其是干预实验，要注重作为干预材料的理论指导基础与实践的针对性。例如，在“心理团体辅导对大学生社会交往能力的干预研究”课题中，心理团体辅导方案基于何种理论的指导？针对哪种类型或特点的大学生？针对大学生的哪类社会交往能力？……这些在实验实施前都应当有严格论证。

（4）实验的实施与结果呈现。

这是研究者按预定的实验方案和工作计划，在一定的理论指导下，操纵仪器、实验装置对实验对象进行观测、研究的实践环节。通过该环节，研究者能获得大量有关研究对象的观测资料，其中包括计算资料、计量资料、等级资料与描述性资料。这些实验结果既包括定量结果，也包括定性结果。对于定量结果，宜选择合适的统计方法加以处理，并按统计规范呈现。

在实验实施过程中，事先要安排好时间、地点、实施人员与材料等，最好定期完成阶段性研究报告，这样既做到研究工作的及时总结和回顾，又能检验自己的工作成果，把握研究方向。整个实验实施阶段临近完成时，要对实验各阶段所作的记录进行系统整理。必要时，对某些尚有疑问的实验结果用重复实验的形式加以检验，尤其是对由某种偶然因素所造成的结果进行仔细追踪，很可能会有重大的心理学发现。

3.实验法的优点与局限

在实验法中，研究者处于主动地位，可以有计划地引起或改变某种急需研究的心理现象，不必消极等待它们的自然发生；实验者可以控制一些偶然发生的因素，排除一些与研究对象无关的因素，从而对对象进行精细的观察，获得定量的结果；研究者还可以改变各种条件，多次重复进行实验，认真仔细地进行核验，揭示条件与现象的函数关系，掌握某种心理现象产生的规律。

实验法的不足主要是，实验研究中对变量的操纵难免受到人为因素的影响，且无法排除所有的无关变量；并且，由于实验法对心理过程的操作和量化要求过高，大大限制了它的应用。此外，由于实验本身人为性较强，在抽样、变量数量与水平、实验处理、实验环境、实验方法等诸方面都难以保证一定的外部效度。目前，单一的、严格的、人为的实验研究受到众多批评，而更生活化、生态化、强调实际应用的现场实验与多因素实验则受到广泛的重视。

（三）测验法

1.什么是测验法

测验法（measurement method），也叫测量法，指用一套预先经过标准化的测验工具（量表）来测量个体的某种心理品质的方法。在心理学研究中，利用科学的心理测验可以预测人们从事各种活动的适宜性，提高人才选拔和职业培训的效率。同时，测验法还可以运用于心理诊断和治疗，对学生的问题与行为进行甄别，为加强对学生的因材施教和个别指导提供依据。

2.测验法的应用程序

从方法上讲，测验法与问卷法相似，但测验法的理论基础更加明确，程序标准化要求更加严格。关于其研究程序在这里略过，可参照下面的问卷法研究程序。这里仅集中探讨测验法在教育心理学研究中的应用。

（1）测验的选择。

选择测验必须注意两个方面：一是所选的测验工具必须适合测验目的。心理学和教育学的许多研究工作都需要通过测验来获得第一手资料。例如，为了查明影响学生学业成绩的心理因素，需要运用智力测验、学习能力倾向测验、成就动机测验、学习兴趣测验、人格测验和学业成就测验等多种测验，通过计算各种心理因素的测量分数与学业成就测验的分类之间的相关系数进行回归分析，然后根据测验所获得的实证资料得出科学结论。但是，不同的测验工具有着不同的理论基础和适用范围，如想了解智力对小学生学习成绩的影响，就不宜采用瑞文推理量表对其智力进行测定，因它主要用来测量一个人的观察力及清晰思维的能力，对于包含各类学科在内的综合学业成就预测力不强。二是所选测验必须符合心理测量学的要求，如该测验是否经过了标准化，它的信度、效度如何，常模样本是否符合测验对象，常模资料是否因时间太久而失效等。如果该量表既适合测验目的，又具有较好的信度、效度，就可直接用于该项测验；否则，研究者需要进行量表修订或是自编量表，具体做法可以参照下文所讲的问卷编制方法。

（2）测验前的准备。

主试自身的准备：首先，主试要熟悉测验指导语并能流利地说出来；其次，主试必须熟悉测验的具体程序；最后，主试必须做好应付突发事件及被被试提问的心理准备。

测验材料的准备：测验材料包括测验题目、答卷纸、记分键、指导书、纸、笔及计时器等。

测验环境的准备：主试必须对测验时的光线、通风、温度及噪音水平等物理环境做好安排，统一布置。

（3）施测过程的标准化。

对于标准化测验，主试必须按照规定的程序施测，才能得到可靠的结果。测验的实施主要涉及两个问题：①如何实施测验才能保证测验分数尽可能少受施测过程的影响；②如何解释分数才能保证受测者的心理不受负面影响。因此，在实施测验时，必须使用统一的指导语，指导语应力求清晰、简明扼要且有礼貌；主试还应告知被试该测验具体的时间限制。另外，在施测过程中，对于被试的反应，主试不应出现点头、皱眉、摇头等暗示性反应，应时刻保持和蔼微笑。

（4）数据的整理和分析。

对测验所获得的结果按照测验工具的不同可从质和量两方面进行。在研究设计时，主试要初步考虑如何对收集到的研究数据、资料进行整理、分类，以及用什么方法进行统计分析。一般而言，测验法有设定好的常模，可以把测验结果与之直接对比研究；或者，依据研究目的与研究设计，通过数据转换直接进行各种描述性统计处理和推断性统计处理，以检验研究假设。

3.测验法的优点与局限

（1）测验法的优点。

心理测验工具的编制一般颇为严谨，并且经过标准化和鉴定，这些测验工具无论其结构还是内容都颇合理、翔实，信度和效度都比较高，心理测验法所得到的结果与结论一般也颇准确可靠。相对于观察法与访谈法等其他方法，心理测验法的定量化水平很高，问题和答案都是以封闭式方式给出的：在施测过程中，主试很容易控制整个施测过程，把被试在回答过程中的主观因素影响降低到最小，得到的资料也比较客观。心理测验法可以在同一时间内对大样本被试进行施测，能在短时间内收集到大量的数据。

（2）测验法的局限。

由于不同心理测验所依据的理论基础不尽相同，所测特质的定义、观点及概念系统也不同，因此，同样性质的测验获得的可能是不完全相同的心理特质。而且，心理测验是对人的心理特质的间接测量与取样推论，其结论不可能完全准确，因为测验过程中的一些无关因素的干扰很难完全排除，它们会影响到测验结果的稳定性与准确性，如一些涉及个体隐私方面的问题，很难保证被试如实进行回答。

（四）问卷法

1.什么是问卷法

问卷法是指研究者采用预先拟定好的问题表，由被试自行填写答案来搜集资料，以此来分析、推测群体心理或行为规律的一种研究方法。问卷法使用成败的关键是找到一份质量上佳的问卷。因此，在运用问卷法研究某一主题时，若有已经被证明具有良好信度、效度的问卷，一般在征得问卷编制者同意并有书面授权的前提下，可以直接拿来使用；如果某份问卷的全套题目及相应的评分标准已公开发表或出版，此时一般无须征得问卷编制者同意，可直接拿来使用，只要在使用过程中详细注明出处即可。但在教育心理学研究领域中，出于研究问题的深入、研究的本土化等各种原因，可能并无现成的问卷可用，研究者往往需要根据研究的特殊要求，自己编制高质量的相关研究问卷。

2.问卷法的研究程序

问卷编制必须遵循的规则主要有六：①科学性原则。问卷题项的区分度、信度和效度都要合乎一定的要求；问卷编制应有逻辑性；问卷题项的措辞力求准确，既要避免出现双重甚至多重含义的表述，也要避免模棱两可或含糊的表述；尽量不使用否定式提问；不问被试不知道的问题；尽量不在同一问卷中平衡使用正向题与反向题，以避免出现项目表述效应（the method effects associated with the item wording）：由项目表述方式的差异引起的与测量内容无关的系统变异，包括正向题项目表述效应和反向题项目表述效应；题项排列一般要遵循“先易后难”“能引起兴趣的在前，引起顾虑的在后”“熟悉问题在前，生疏问题在后”“先行为后态度”（或“先客观后主观”）与“结构式问题放在前，开放式问题放在后”的顺序；问题的答案设计应遵循“穷尽性”（即答案中要包含该问题所有可能存在的情况）和“互斥性”（即同一问题中各答案之间相互不能包含或者重叠）两个基本原则。②适用性原则。编写问卷题项时，应将“为被调查者着想”作为问卷设计的出发点，所以，题项表述要简洁、通俗易懂，尽量不用专业术语和抽象概念，也要尽量避免题项中包含过多的复杂计算；并且，问卷的题量不宜过多，一般以被试能在20～30分钟内做完为宜，最好不要超过40分钟，以免引起被试的厌烦心理或让被试身心疲惫。③针对性原则。问卷的题项要围绕主题。④行为性原则。问卷尽量不要提出带有倾向性、敏感性或“直截了当”的问题，因为带有倾向性的问题可能会影响被试的作答。敏感性问题可能导致被试拒绝作答，如若问一些个人的隐私问题，易导致被试拒绝作答；也可能让被试作出社会赞许性或社会期望（social desirability）的作答。例如，若问一个被试是否爱国，他一般会回答爱国。直截了当地提问题，可能会让被试猜出研究者的意图，从而作出投研究者所好的答案；也可能因问得太直截了当，让被试拒绝作答。所以，题项的表述要有一定的行为性，它既可以达到迂回投射的作用，又可以使内容表述具体化，使被试容易回答，也愿意回答。⑤艺术性原则。问卷题项或内容应活泼有趣。⑥伦理道德性原则。问卷的题项不能违背伦理道德规范，问卷的整个施测过程也要合乎伦理道德规范。

问卷法的一般研究流程如图1-5所示。

图1-5 问卷法的一般研究流程示意图

根据图1-5所示，问卷法的一般研究流程大致分为如下三步：

第一步，确定一个有价值的研究主题。

第二步，对该研究主题进行理论探讨，然后提出假设并编制问卷的理论架构。例如，为了调查当代中国人对谦虚的看法，就须先进行理论建构。若借鉴梁觉等人提出的“工具性和价值性和谐二维模型” ，我们也可以建构出“工具性和价值性谦虚二维模型”，其核心观点是：谦虚（modesty），也叫自谦（self-modesty），指个体通过低调的自我展现，以期取得以退为进、以柔克刚或以弱胜强效果的待人接物方式。人们往往出于两种不同的动机或目的而谦虚：一种是“价值观谦虚”（value modesty），它信奉“谦虚是美德”的理念，强调谦虚本身的重要性，把谦虚作为终极目标，是价值观的体现，于是，真心以谦待人处世。另一种是“工具性谦虚”（instrumental modesty），它并不认可谦虚的价值观意义，只重视谦虚的工具性价值，将谦虚作为工具和手段，力图通过谦虚来实现其他功利目的。如果将价值观谦虚作为一个维度，将工具性谦虚作为另一个维度，就可以得到工具性和价值性谦虚二维模型（如图1-6所示）：①圆满型：高工具性谦虚+高价值性谦虚。拥有圆满型谦虚的人既重视谦虚的工具性价值，又重视谦虚的价值观意义，不仅知道谦虚在实现人生目标中的重要性，也将谦虚作为理想追求的目标，进而将谦虚既作为工具又作为目的。②信念型：低工具性谦虚+高价值性谦虚。拥有信念型谦虚的人较少考虑谦虚的工具性价值，而真心将“谦虚做人”作为自己的人生信条。③傲慢型：低工具性谦虚+低价值性谦虚。这种人既未看到谦虚的工具性价值，也未看到谦虚的价值观意义，不识“天外有天，人外有人”的道理，往往目中无人，傲慢待人。④工具型：高工具性谦虚+低价值性谦虚。认可工具型谦虚的人不关心谦虚的价值观意义，而是将谦虚作为实现自己其他功利目标的工具，为此，在必要时可以刻意假装谦虚，以博取对方的好感。

图1-6 工具性和价值性谦虚二维模型示意图

第三步，编制初步问卷。在自编问卷时，整个问卷要体现先前提出的理论架构，并对结构的各维度进行操作性定义，在此基础上撰写问卷题项。在撰写问卷的题项时，既可以先通过文献综述获得一些编写题项的资料与灵感，也可以通过与少数人（如本领域的专家或潜在的被试）进行深入访谈或进行小规模的开放式问卷收集编写题项的资料与灵感，还可以根据自己的知识经验编写题项。随后，要将自己编制出的原始问卷进行一次或多次试测，既要对试测过程中发现的问题及时解决，又要对试测后所获数据进行分析，根据所获结果及时调整问卷的题项，以便最终产生正式问卷（若是对问卷的要求不太高，此步骤也可省略）。接着，收集初测问卷的数据并进行项目与信度、效度分析。在做这项研究工作之时，有四个环节必须注意：

一是把握好被试选择环节。具体要注意三方面的问题：①确定被试来源的群体。试测时所用样本与正式问卷时所用样本来自同一个总体。②考虑被试的代表性。在一般情况下，要么分层随机抽样，要么简单随机抽样。③样本要足够大，以防回收率过低而影响到研究结果的可靠性。

二是试测的过程应当做到科学、规范。施测程序、指导语等均应当标准化，同时应当注意记录施测过程中被试的各种反应、施测所需时间等，以作正式施测标准化的参考。例如，根据问卷实施的目的、对象不同，决定选择不同的实施方法。如针对某一个人的调查，可以采用个别问卷调查或电话调查的方法；针对一个群体的调查，可以采用团体问卷调查的方法，并且，注意指导语和施测时间。问卷的开头一般都有指导语，包括说明研究的目的、研究的重要性、不泄漏隐私、如何勾选等内容，这类问题是控制被测者反应的一个重要环节。因此，要确保被试者了解指导语。

三是剔除无效问卷。标准一般有四：出现大量未答项目，作答方式明显呈现出某种规律，未通过测谎题的检查，明显未认真作答者。

四是要对问卷质量进行相应的分析（若是简单的问卷调查，可省略此步直接进入下一步）。在对问卷质量进行相应的分析时，一般需要做三件事情：

（1）认真进行项目分析。

在进行项目分析时，一般用求临界比率（critical ratio，简称CR值）和相关法进行分析：将所有被试的问卷按总分由高到低的顺序进行排列，得分前27%者为高分组，得分后27%者为低分组，求出两组被试每个项目得分的平均数，然后进行平均数的差异性t检验，检验高分组的得分是否明显高于低分组的得分。假若题项的得分在高低分组上的差异显著，就表明该题项有良好的区分度，能鉴别不同被试的反应程度；反之，如果CR值没达到显著性水平，则表明该项目不能鉴别被试的反应程度，应剔除。同时，进行项目区分度分析时，要采用相关法来计算各项目与其所属类别总分的相关系数，删除相关系数小于0.4的题项。

（2）对问卷进行信度分析。

所谓信度，即测量的可靠性，指通过测量所获得结果的一致性或稳定性程度，包含两个意思：一是用同一个测量工具重复测量某个持久的特性时，是否能得到相同的结果，即测量的尺度是否稳定、可依赖；二是测量能否减少随机误差的影响，而能提供关于所要测量的某特性的真实情况。信度系数通常用测得的两组分数间的相关系数来表示，其数值越大即表示该测验的信度越高。信度系数只是对测验结果的稳定性或一致性的估计值，在不同情况下，对不同样本采用不同方法会得到不同的信度系数，即一个测验可能不止一个信度系数。若对自编问卷进行信度分析，一般至少要算出两个信度值；并且，只有至少两个信度值都符合相关要求时，这个问卷的信度才是合格的。应当注意的是，在经典测量理论中，主要有重测信度、复本信度（也叫平行信度）、分半信度、同质性信度（也叫内部一致性信度）和评分者信度五种信度，各种信度考察的误差来源不同，故我们所选择的信度至少应当提供两种以上不同误差来源的信度值。例如，由于分半信度与同质性信度考察的误差来源基本上是相同的，所以，若只计算某个问卷的两种信度，那么，“分半信度+同质性信度”的搭配一般不理想，改作“分半信度+重测信度”或“同质性信度+重测信度”会更好一些。再者，在计算问卷的内部一致性信度时，若问卷不是单一维度，除了要计算并报告总问卷的内部一致性系数外，最好还要计算并报告每一个维度的内部一致性系数。

重测信度。它指用同一种测验对同一组被测者前后施测两次，从而计算前后两次测验结果的相关系数，以估计测验的信度。要保证重测信度的准确性，一是要注明两次施测的时间间隔，这可以随研究的目的或材料而异，短则一两周，长则一两个月，一般不超过六个月；二是两次所施测的样本要一致，并且需要将前后两次施测的同一样本的测量结果一一对应起来进行统计，如A1—A2,B1—B2。对重测信度可采用皮尔逊积差相关计算，0.90以上时认为重测信度较高，测量较为可靠；不符合积差相关条件的资料可用等级相关计算。重测信度主要反映两次测验结果的变动情况以及测验工具的稳定程度，其优点是提供了对于测验结果是否会随时间而变的结论，缺点是前后两次测量的结果易受被试练习、记忆或厌倦心理的影响。可见，若想计算问卷的重测信度，就必须保证同一批被试能够先后做两次问卷，且要保证每一被试先后两次所做的问卷能够一一对应，即被试A第一次做的问卷若编号为A1，那么，被试A第二次做问卷的编号则为A2;被试B第一次做的问卷若编号为B1，那么，被试B第二次做问卷的编号则为B2;依此类推。因此，若想做重测信度，如果问卷里包含的所有题项都不涉及个体的隐私等敏感信息，最好在让被试作答时，两次都请被试署上姓名，这样就方便一一配对并排序了；若问卷中有一些题项涉及个体的隐私等敏感信息，最好在请同一批被试作答前，两次都事先将同一批被试（若是学生）按其学号顺序安排座位，然后主试再将相关座位信息记下，并按座位顺序逐一回收问卷，这样也方便事后一一配对并排序。若无法保证两次找到同一批被试（如站在大街上随机取样），或者，即便能够两次找到同一批被试，事后也分不清哪份问卷是由哪个被试作答的，就不可能计算重测信度。

复本信度。如果测量有两个或两个以上的复本（即通常所说的两个内容与性质相似的A测验与B测验），可先后对同一组被试施加两个复本测验，这样可得到同一样本前后两次施测的两个分数，计算两个分数之间的相关系数，即复本信度。在施测方法上，一是同样要注意前后两样本的一一对应；二是要注意消除测验的顺序效应。消除顺序效应可采用此种方法：令被试的一半人先做A本测验，后做B本测验；令被试的另一半先做B本测验，后做A本测验；然后计A本测验分数与B本测验分数的相关程度系数。复本信度侧重内在的一致性程度，与重测信度相比，其可信程度更高，但其缺点是，主试一般难以获得内容与性质高度一致的两个测验工具。

分半信度。在没有较好复本的情形下，要想考查测量的信度，通常是将受测者的分数按题目的单双数分成两半计分，然后选用恰当的方法计算A部分与B部分之间的相关系数。通过此法获得的信度叫分半信度。在相等条件下，测验长度越长越可靠。

内部一致性信度。它是对分半信度的发展，即考查测验内部所有项目分数之间的一致性程度。如果整个测验具有相当的效度，而其中每个项目与整个测验一致时，即可推论每个项目也具有相当效度。最常用的方法是计算克伦巴赫α系数。因此，若要计算内部一致性信度，就必须保证问卷具有同质性。

评分者信度。评分者信度一般适合用于主观题。所谓评分者信度，是指不同评分者对该测验工具进行评判时所得结果的一致程度。如果各评分者都对该测验作出客观的、高度一致的评分，则可以认为该测验具有较高的评分者信度。但是对于一些测验，不同的评分者所掌握和理解的标准不同，可能得到不太一致的结果。评判评分者信度的传统的方法就是：当评分者的人数为2时，评分者信度就等于两个评分者给同一批被试的测验所给分数的相关系数，通常情况下可以求积差相关或等级相关；而当人数多于两个时，评分者信度可用肯德尔和谐系数进行估计。现代测量学中也采用了FACETS模型的RASCH评定法，该方法主要是以项目反应理论的应用为基础，对评分者信度进行直接测量。需指出，若两个或多个评分者对某测验工具的评判结果高度一致，但实际上他们的评判结果均是错误的，此时便会出现“评分者信度虽高，却明显降低了测验的效度”的情况。一旦出现这种情况，便要及时采取补救措施。例如，及时对评分者进行再培训，以提高其对评分标准的准确理解度；或者，用专家替代错误率较高的评分者等。

（3）对问卷进行效度分析。

所谓效度，即测验的准确性，指一个测验或测验工具能够测量出其所要测量的内容的程度。测量结果与要考察的内容越吻合，则效度越高；反之，则效度越低。测验的效度有各种不同的类型，最常用的有如下三种：

内容效度。它指测验题目对有关内容或行为范围抽样的适当性（或代表性）。例如，教师要了解中小学生道德品质发展的总体情况，若时间与条件允许，可以对中小学生知、情、意、行各个方面所包括的内容进行一个全面的测查，但事实上这是行不通的。因此，教师只能选择有代表性的部分内容或项目进行测查，用测查的结果推论总体情况。但是，所选内容的代表性将会影响对总体情况进行推论的准确性。内容效度的检验方法主要是专家判断。

结构效度。它指测验能够检验到理论上的构想或特质的程度。确定测验的构想效度一般是采用由果溯因的方式，即先从某一理论构想出发，导出与构想概念有关的各种假设，再根据假设编制测验，最后分析测验结果与理论构想的吻合程度。若两者比较吻合，则说明测验具有较高的构想效度；否则，可能是理论假设的错误，或是测验本身的问题，此情况需要作进一步分析研究。构想效度可用探索性因素分析和验证性因素分析的方法加以考察。

效标效度。它指测验分数与效标之间的相关程度。所谓效标，是指衡量测验有效性的参照标准。若测验分数与日后的行为表现有较高的一致性，则可以说测验预测的准确性是比较高的。例如，一个亲社会行为的测验，其效标可以是个体今后的亲社会行为表现。效标效度可用测验分数与效度标准之间的相关系数来表示。

若对自编问卷进行效度分析，一般至少要算出两个效度值（在上述三种效度中任选两种即可）；并且，只有至少两个效度值都符合要求时，这个问卷的效度才是合格的。

第四步，编制正式问卷。使用或修订初测问卷所保留的题项对重新获取的被试样本进行施测，收集数据并进行问卷的质量评估。具体包括以下基本过程：首先，选择新的被试样本进行数据收集工作。实施程序如初测。回收已作答的正式问卷，剔除无效作答问卷后，将所有有效作答的问卷进行排序。为提高回收率，最好能够取得一定组织机构的协助，如在学校进行施测时征得校长、班主任的同意，通过他们帮助组织实施调查。要注意对问卷的审核，以确保所得数据资料的质量。同时，若条件允许的话，辅以其他的方法，如对个别接受问卷调查的对象进行访谈，了解更具体的情况。其次，录入并选择相应的统计方法处理数据。将已排序的有效作答问卷的相关信息逐一准确录入SPSS或MPLUS软件中作数据处理，获得相应的结果，然后对所获结果进行整理后输入Word文档中。并且，与前文处理测验数据类似，在问卷设计时，也要初步考虑如何对收集到的研究数据、资料进行整理、分类，将用什么方法进行统计分析，据此对收集资料的方法和内容提出进一步的要求。例如，如果研究结果将用计算机处理，则在问卷设计时就应考虑到如何使数据的录入方便。假若事先不加考虑，就可能会出现最后找不到适当的统计分析方法、数据录入困难等情况，从而影响研究工作。通常情况下，数据的结果处理包括项目分析、信度和效度分析。再次，对所获结果进行分析与讨论。在进行分析与讨论时，必须与同类或相关研究成果进行比较。无论比较结果是同还是异，都必须进一步分析其原因，切不可将“分析与讨论”写成“结果（一般是数据与图表）”的“文字说明”。最后，根据分析与讨论，最终证实或证伪假设，并形成结论。一般而言，在一项问卷研究中，有几个假设就可得出几个结论，结论的数量不宜过多，但必须是可靠、可信的。同时，为了提高研究的科学性与深度，在一项问卷研究中，假设的数量不宜过多，一般有1～3个假设就足够了。

3.问卷法的优点与局限

问卷法的优点是能发现人们对现实情景的反应，特别是能较快地收集现时现场大样本人群的心理状态与行为方面的信息；也有利于主试对取样者进行较好的处理。随着计算机技术的迅速发展，人们处理通过问卷法获得的数据的能力得到了迅速发展。

问卷法的主要缺陷有：①一般不能准确掌握现时现场人们的过去心理状态，因为人们往往记不准他过去的所作所为。②一般不易掌握被试的内隐心态，因为人们的内隐心态往往处于无意识水平，通过一般的问卷是很难了解到的，必须运用内隐联系测验（Implicit Association Test，简称IAT）之类的技术才能捕捉到。③当问卷中有一些含道德色彩或价值导向的问题时，被试易受社会赞许效应影响而掩饰内心的真实态度；有时被试也会迎合调查的需要或受主试的主观因素影响；还有些被试因缺少诚信，常常不愿真实作答。若出现此类情况，被试的作答往往不准确。因此，问卷的信度、效度常受人们的质疑。④一般的研究者往往难以设计出一个好问卷，因为问卷编制需要遵循许多规则，虽然有些著作专门讨论问卷编制应遵循的规则，但初学者往往难以真正掌握它。⑤问卷设计完之后，所调查的内容就已确定，然而，当题目不适合被调查者时，被试只能是猜测、放弃或随机应答。同时，由于主试无法直接观察每个被调查者，这就导致主试失去了记录被试回答问题时的反应机会。 ⑥问卷法对被调查者的文化水平有一定要求，故问卷法一般不适合用来研究幼儿、文盲的心理与行为。⑦问卷回收率有时难以保证。⑧有时不能保证填答问卷的环境和质量。⑨对问卷发放的要求较高，不能出现抽样偏差。⑩依乐国安教授的见解，问卷法在使用过程中还要尽量避免方法上的机械主义、手段上的经验主义、取向上的个体主义和结论上的普遍主义等四个缺陷。

所以，除非有成熟的问卷或者自己善于编写问卷，除非仅是想摸清被试心中某种处于意识层面（而非无意识层面）的想法或态度（至于此想法或态度是对或错则没有关系，即仅做事实描述，不做价值判断），否则，不要轻易用问卷法，更不要在没有扎实理论基础的前提下去随意自编问卷并开展研究。试想，若被试对智慧缺乏正确认识，你能用问卷的结果去衡量一个专家建构出的智慧理论的正确与否？显然不能。因为前者充其量仅是被试对智慧的一种极不成熟、极不深刻的看法，它与专家的深刻反思、深刻理解和科学建构相距甚远。同时，若缺少扎实的理论研究，如何保证能编出高质量的问卷？在做因素分析时如何合理确定因子的数量？在用结构方程技术做验证性因素分析以检验问卷或量表的结构效度时，如何保证给相关因子进行合理命名？如何有效确定某个结构模型的好坏？若对这些问题都“存而不论”，在做因素分析时只依靠“碎石图”与“项目的因子分布及负荷量”来确定因子的数量，在做验证性因素分析时只根据“模型的主要拟合指数”来确定某个结构模型的好坏，这两种做法完全都是由数据驱动，属典型的“脚踩西瓜皮，滑到哪算哪”的做法，其科学性会大打折扣。顺便指出四点：

第一，在问卷编制的数据处理中，通常采用探索性因素分析或验证性因素分析统计方法，但二者使用的情境有差异：围绕某一主题编制问卷时，若此主题尚缺乏相对较成熟的理论的指导，通常采用探索性因素分析方法以探索其理论结构；若此主题已有相对较成熟的理论作指导，或者是基于前期较科学的探讨基础上，通常就采用验证性因素分析方法来验证其理论结构。

第二，由于变量间的相关性是进行探索性因素分析的首要条件，所以先根据相关标准对因素分析的相关性进行考察。变量间的相关性用Bartlett球形检验，其是否达到显著由KMO系数来确定，标准如下：KMO系数在0.90以上非常适合进行因素分析，在0.80～0.90之间为适合进行因素分析，在0.70～0.80之间尚可进行因素分析，在0.60～0.70之间不太适合进行因素分析，在0.50以下极不适合进行因素分析。在列因子负荷矩阵时，每个因子名下的题项均按因子负荷值从高至低排序，除要列出每个因子的特征值、贡献率以及所有因子的累计贡献率，还要列出每个题项的共同度。同时，在兼顾理论指导的前提下，要先依据四个统计标准剔除问卷中的不合适题项：①共同度低于0.40的题项；②在任一因子下的负荷值均小于0.40的题项；③因子归属明显不当或不易解释的题项；④在两个或大于两个因子上的负荷值都高于0.40的题项，结合理论构想部分予以删除。再根据以下三个统计标准确定因子数目：①特征值大于或等于1;②因子符合陡阶检验；③每个因子至少包含三个项目。

第三，如果在理论建构中发现可能存在两个或多个模型，在做验证性因素分析时就须提供相应的竞争模型；反之，假若在理论建构中发现只可能存在一个模型，在做验证性因素分析时就无须提供竞争模型。当有竞争模型时，若同时有两个或两个以上模型的主要拟合指数都达到了理想标准，一般就选用其中一个相对更简单的模型，因为“大道至简”。

第四，验证性因素分析中常用拟合指数的标准一般是：χ 2 /df(卡方值与自由度之比，是基于拟合函数的指数）的值要小于5。在绝对指数（Absolute index，它旨在衡量所检验的理论模型与样本数据的拟合度，其只涉及理论模型本身，没有与别的模型比较）中，“近似误差均方根”（Root mean square error of approximation,RMSEA）≤0.08可以接受，且越小越好； “标准化残差均方根”（Standardized root mean square residual,SRMR）≤0.08时模型可以接受，当SRMR>0.08时，模型一般被认为拟合得不好。在相对指数（Relative index，它是将所检验的理论模型与基准模型进行比较，观察拟合度改进了多少）中，“规范拟合指数”（Normed fit index,NFI）、“非规范拟合指数”（Non-normed fit index,NNFI）、“比较拟合指数”（Comparative fit index,CFI）和“递增拟合指数”（Incremental fit index,IFI）的变化范围在0～1之间，0.90以上可以接受，越接近1表示模型拟合得越好。

4.问卷法与测验法的比较

问卷法与测验法一般都需要预先拟定好一个问题表或量表，二者在研究程序（包括研究对象的确定、施测过程、数据处理、分析与讨论、获得结论等）方面也有相似之处，以至一些人常将问卷法与测验法相等同。其实，问卷法与测验法是两种不同的研究方法，二者之间的明显区别至少有三：①是否有常模的差异。一般而言，问卷法无常模，而测验法有常模。②对信度与效度的要求不同。相对而言，在编制用于心理测验的量表时，对信度与效度的要求都很高；在编制用于调查的问卷时，除非常严谨的问卷对信度与效度有较高要求外，一般的问卷可以不计算信度与效度。③适用范围不同。问卷法一般只适用于研究群体的心理与行为，却不用来研究个体的心理与行为；与此不同，测验法既可用于研究群体的心理与行为，也可用于研究个体的心理与行为。

（五）访谈法

1.什么是访谈法

访谈法，也叫访问法，指调查者通过与受访者交谈，进行调查和收集资料，并分析和推测受访者心理与行为规律的一种研究方法。访谈法分结构性访谈和非结构性访谈两种：前者用高度结构化或标准化的调查提纲进行访谈；后者不使用或用简单的调查提纲，只提出一些笼统的、开放性的问题。调查者在引导、发问、追询、记录及使用访谈工具时，都要尊重对方，且忠实于所研究的问题，才能获得准确完整的资料。访谈法采取“主试问，被试说，然后主试记录被试的反应”，经过深入面谈可以获悉被试在某一方面或多个方面的详细信息，如被试的需要、价值观与人格特点等；同时，访谈者不仅可以听其言，还可观其举止表情。访谈法不像问卷法那么标准化，它是交互式的，访谈者可以根据回答者说的内容改变问题。

访谈法具有如下特点：①目的性与规范性。访谈法作为一种研究方法，与其他科学研究方法一样，具有目的性和一系列的操作规范。科学研究中的访谈法不是漫无目的地“聊天”，它是为回答某些问题或检验研究假设而谈的，对访谈的人数、谈话的内容、谈话的程序等都有明确规定。②交互性。访谈法的显著特点是访谈者与被访谈者的直接交互作用，访谈过程是以访谈者与被访谈者之间问与答的形式进行的，谈话双方的心理特征、态度、期望、动机、知觉和行为等相互作用、相互影响。③灵活性。访谈者可以根据访谈目的，对一些感兴趣的行为表现、活动结果“刨根问底”。

一般人认为访谈方法简单，其实不然。从某种程度上说，它是“最难”的方法。因为这里存在着主试与被试之间相互作用的问题。这种交互作用本身就是某种人际关系现象，需要对此进行特殊的研究。因为，在交谈的互相作用、沟通的每一个过程中都可能带有主观性，从而影响信息的可靠程度。所以，用访谈法来研究的主试，要经过严格的培训和训练，以免对调查结果产生不良影响。好的访谈者除了对社交中发现的信息敏感外，对社交过程也是十分敏感的。访谈者与回答者建立和善的、积极的社交关系，鼓励回答者信任访谈者，并与访谈者分享个人信息。可见，访谈法中所获得的材料的丰富性和客观性，在很大程度上依赖于研究者的机智和谈话技巧。

同时，依张登浩先生的观点，在整理访谈资料时要做到：第一，逐字逐句地整理。第二，阅读原始材料（如“投降”一词，在不同被试的言语中可能有不同的意义），寻找词语及词语背后的准确意义，切忌“对号入座”。第三，条目抽取时要注意每一个有意义的最小单位。第四，同类项合并时要注意归类。第五，条目删减时要注意妥善删除一些“个性化”（对别人来说没有意义，不具代表性）的表达方式。第六，适当改写时要注意尽量使用访谈者的原话。第七，进入问卷。

2.访谈法的研究程序

（1）明确访谈目的。

明确访谈目的要考虑以下问题：一是将访谈目的转化为具体的研究问题和研究变量。访谈目的往往比较笼统、概括，需要将其转化为比较具体的、有限定性的研究问题，然后根据具体研究问题，列出涉及的变量的名称和类别，这样才能为组织和细化访谈维度做好准备。二是选择访谈类型。访谈类型常因研究目的而异。例如，依据对在访谈过程中“问”与“答”的限定情况，可以把访谈法分为结构访谈、非结构访谈和半结构访谈；依据每次接受访谈人数的多少，可以分为个别访谈、团体访谈；依据访谈沟通方式中是否借助中介物，可以分为直接访谈和间接访谈。三是注意调控访谈过程。口语交流相对于书面用语有较大的随意性，访谈对象在进行陈述时，容易“触景生情”引发联想，而使回答偏离主题。访谈者要根据访谈的目的，及时控制访谈进程，使之按预定目的进行。

（2）编制访谈表。

访谈表是实施访谈的依据，访谈表不仅包括发问的问题，而且对访谈对象的回答也有所规定。编制访谈表主要包括如下工作：一是设计问题形式。依据确定的访谈目的，编写具体的问题，问题可以以不同形式呈现。如依据问题的结构可把问题分为开放式问题和封闭式问题。开放式问题不限定答案范围，访谈对象可根据自己的想法来作答，如“你认为这会给小学道德教育带来什么影响”；封闭式问题要求访谈对象在事先确定的几个答案中进行选择，选出自己认为最合适的答案，如判断式、核查式、评定式、排序式等。二是依据所选择的问题形式编写访谈问题。一般而言，访谈问题要尽量做到口语化、清晰化、简洁化、通俗化、情感态度中立、避免触犯对象隐私与禁忌等。

（3）实施访谈。

访谈的实施主要包括以下几个环节：一是初步接触。在接触访谈对象的过程中，要注意几个问题——形成好的第一印象、取得访谈对象的信任、采取策略等。二是进行提问。对访谈对象进行提问时要尽量按照访谈表上的问题与顺序进行；发问的语气与方式要保持中立，对对象的回答不要流露出批评、惊讶、赞成或不赞成的语气与态度；注意营造访谈的轻松、愉快、友好气氛，使对象畅所欲言，不轻易突然打断或中止访谈对象的话；对访谈对象出现回答不完整、不清晰、不具体或答非所问时可对其采用重复问题、复述回答、表示理解与兴趣、停顿、提出中性评论等方式进行探究。三是在访谈的全过程中，访谈者要始终全神贯注地倾听访谈对象讲话，并及时做好记录。四是在结束访谈时要注意向访谈对象表示感谢，或为今后的研究抽样做铺垫；若访谈不能正常结束时，访谈者应具体问题具体分析，灵活处置。

（4）访谈结果的整理与分析。

对于结构性访谈其结果可进行量化分析；而对于非结构访谈，一般情况下，为了对结果作深入分析，非常重要的一步工作就是制订编码（或评分）系统，用编码系统来量化访谈结果。

3.访谈法的优点与局限

访谈法的优点主要有：可以控制问题的呈现过程及访谈进程，访谈对象可重复表达自己的思想和感情，可获得较为全面、深入、具体的资料。访谈法也有一定的局限性：首先，它比一般的实证实验法对研究者提出了更高的要求。如果不经过严格的训练是很难真正掌握并灵活运用这一方法的。其次，访谈法在具有灵活性这一优点的同时，也不可避免地增加了实验研究的不确定性，对资料分析的误差较易发生。再次，访谈法是通过语言来实施的，主试的口头表述和儿童的口头报告都对言语能力提出了较高的要求。尤其是对幼儿而言，由于他们言语能力的限制，往往难以准确表达自己的想法，而这种不准确的表达又容易导致主试的误解，从而影响研究工作的可靠性。因此，较为理想的研究方法应该是综合观察、谈话、实验、测验等方面的长处，通过多种途径对儿童展开研究，方能保证实验的客观性和科学性。

（六）个案法

1.什么是个案法

个案法（case method），是指对单个人、家庭、团体等社会单元或某件典型事件进行深入、系统的观察与研究，以便发现某种心理或行为规律的一种研究方法。它是由医疗实践中的问诊法发展而来的。

2.个案法的研究程序

（1）研究问题的界定。

先要确定研究的问题，问题一旦确定，便能有效指导资料的收集、分析与解释。研究者通常先提出一系列较为灵活的问题或假设，在研究过程中通过深入思考、探索和修正，使之尽快确定下来，以便指导以后的工作。

（2）对个案的界定。

研究者选择个案时，通常有两种情况：其一是对个案本身感兴趣，想要深入地了解与之有关的问题，这类研究被称为内在性个案研究；其二是通过对该个案的研究探索某种一般性的问题或将结论推广至其他的个案，这类研究被称为工具性个案研究。无论出于哪种情况，研究者都应该在研究设计时对个案的概念作出清晰界定，并指出选择它的原因。

（3）研究方案的设计。

个案研究设计的核心内容就是在不同条件之间进行比较，因此在实施过程中还要考虑具体的设计方法。这里的设计条件主要有两种：基线条件和干预条件。基线条件指未实施特定实验干预时的基本状态，通常用条件A表示；干预条件指引起研究对象行为变化或修正研究对象原有行为的各种干预状态，通常用条件B表示。个案研究通常根据基线条件和干预条件的呈现顺序，来选择具体的设计类型。具体设计方法主要有：①A-B设计，研究者主要通过A和B两个条件的比较来确定实验处理的效果。②A-B-A设计，即先在一段时间的自然状态下，连续搜集最初的资料，确定研究对象的行为基线或反应方式；然后在随后的一段时间内引入干预处理，并观察研究对象的行为变化，继续搜集和记录有关资料；最后撤销干预计划，把实验条件反转到原来的基线状态，并在之后的一段时间里继续观测和记录研究对象的变化情况，再次搜集自然状态下的基线资料。③A-B-A-B设计，即在第二基线条件之后，再一次呈现干预条件。多基线设计，指实验设计时先测完数种基线的方法，主要包括跨行为多基线设计、跨情境多基线设计、跨个体多基线设计。（4）结果呈现的方式。

结果呈现的方式，包括预期得到的结果，其代表性、概括性如何，向什么人呈现结果，其能力水平、背景如何，以何种方式呈现结果等。

3.个案法的优点与局限

个案法的明显优点是：由于个案往往都是鲜活的、具体的，因此，研究者往往能够对这些具体个案进行深入、细致和全面的研究，甚至详细回答诸如“是什么”（描述个案）、“为什么”（解释个案）和“怎么样”（跟踪个案）等问题，从而可发现适合这些个案的某些特殊规律，甚至通过全面深入地解剖某一个案来推断同类现象。同时，通过个案法可以获得某个个案的心理特征、发展状况的全貌，并能分析该个案中有关个体或群体心理现象产生的原因、背景及过程，是揭示个别差异的有效研究方法。在研究设计、数据收集和统计分析等方面，个案法既注重初试或现象的质的方面，又注重其量的方面；既注重全面收集数据，又注重深入了解对个体具有重要含义的资料。这为建立合理的变量关系的假设和因果关系的推论奠定了基础。个案法依据对个体的深入分析，还可以准确把握个体的心理状态、发展水平，并能正确找出其成因与影响因素，从而作出正确的诊断，在有关个体的临床矫治实践与发展指导研究中具有十分重要的价值。

个案法的局限在于研究的被试量较少，对于选出的样本在多大程度上能代表其抽样的总体，其获得的研究结论在多大程度上可以推论到总体的状况以及能否作出更概括的结论，研究者都必须持谨慎的态度。同时，由某些渠道获取的资料可能会偏离或歪曲真实情况，假如当某些问题涉及个人隐私时，被试可能出于自我价值保护的考虑，使研究者不易取得真实的客观资料。再者，在收集个人生活史资料时，由于个人生活的漫长、复杂等因素，可能使资料收集花费许多时间。此外，目前心理科学研究中使用的统计分析方法大多是在总体与抽样、正态分布等假设基础上发展起来的，这些方法对于个案法的数据统计并不完全适用。

（七）语义分析法

语义分析法，也叫字形字义综合分析法（method of semantic and etymological analyses），是指先分析某一字的字形特点及其中所蕴含的意义（尤其是心理学含义）；接着从历史演化的角度剖析此字的原始含义及其后的变化义，以便澄清此术语的本来面目；然后再用心理学的眼光进行观照，界定出此术语在心理学上所讲的准确内涵或揭示出其内所蕴含的心理学思想的一种研究方法。在研究过程中，对于某一概念进行语义分析时，其具体做法一般是：

第一步，将某一字或术语在中国历史上曾经使用过的各种名称尽可能全面地罗列出来。如果有足够证据确信某一字或术语在中国文化里只有一种写法，那么，这一步可以省略，直接进入第二步。

第二步，通过查找《尔雅》《说文解字注》《尔雅翼》《字汇·字汇补》《字源》《甲骨文字典》《辞源》《汉语大字典》《辞海》等工具书，将这些名称在中国历史上曾经使用过的字形与字义（用法）尽可能全面地罗列出来。

第三步，根据某一汉字在汉字史上曾经出现过的诸种字形，选择其中最具代表性的一种字形进行深入分析，以便从字形上揭示出该字的原始含义，由此更好地看出其诸种引申含义。在判断某一字的最具代表性的字形时，一般是参照下述第一个标准（当某一个汉字古老的写法只有一种时）或综合考虑下述两个标准（当某一个汉字古老的写法存在多种时）来选择的：一是时间上的早晚。汉字一向是朝着实用、简化和规范的方向发展，特别是在“汉隶”（即“今隶”）字体产生后，汉字在字形上已定型，其字形较之相应的古字体，一般都已发生了巨大变化。因为隶书字体的主要特点是：改曲为直，取消逆笔，简化偏旁，混同偏旁，省略篆文中的一部分。这样，从时间上看，除非某个汉字是在汉代之后才诞生的（若果真如此，自然只能选用其诞生时的字形加以分析了），否则，一般是选择那些在中国汉字史上出现时间尽可能早的汉字字形作为最佳代表进行深入分析。具体地说，这个“早”一般至少是指“秦隶”（即“古隶”）及其以前的字形——若能找到相应的甲骨文的字形更佳；由于有些汉字至今只能找到其金文字形，却没有发现其甲骨文的写法，所以，退而求其次，对于那些暂时找不到甲骨文字形的，找到相应的金文字形也可。以此类推。如果是以“今隶”或其后出现的某一字形进行分析，由于这些字形出现的时间太晚了，往往很难再看出其最初的样子，也就很难从中得出一些有价值的东西了。二是字形的完整度。由于一些越古老的汉字，其写法往往越简单，从一些太过简单的字形里往往难以看出更多的信息，所以，从字形的完整度上看，如果一个字既有非常简单的古老字形，也有相对更加复杂、完整的古老字形，那么，一般要选择那些最完整的古老字形用作进一步分析的字体。

第四步，目前教育心理学在做比较研究时，主要是进行中外尤其是中西对比。为实现这一研究目的，一般根据某一字的含义，将其中带有封建色彩的用法、在今天较少使用的用法、带有方言色彩的用法和名异实同的用法一一剔除掉，然后综合考虑下述三个标准，从其中选出一个在历史上使用时间长且至今仍广泛使用、内涵最具代表性、能较好地与现代西方心理学中相关术语进行匹配的概念或用语作进一步分析使用：①在中国汉字史上出现时间的早晚和持续时间的长短：一般而言，出现时间越早，持续使用时间越长，往往越具有深厚的文化底蕴。②使用人数的多寡：使用人数越多越具有代表性。③今天的中国人是否仍在广泛使用它：如果今天的中国人仍在广泛使用，说明其至今仍具有强大的生命力。

第五步，仔细分析这一概念或用语的诸种含义。先考察出这一概念或用语的“原始含义”，然后再理清其后的“变化义”。在做这一步的研究时，较为常用的做法是：先查一些经典的工具书如《说文解字》等，然后看这一用语的最古写法（一般是指甲骨文或金文上的写法），继而通过交替使用第三、四步的功夫，将二者结合起来分析其诸种含义。

第六步，用心理学的眼光去谨慎地审视这一用语的所有含义，将其中确有把握与心理学没有关系的含义剔除掉。

第七步，将余下的诸种含义与外国心理学尤其是西方心理学的相关术语的含义进行比较，看看其在哪些方面与外国心理学尤其是西方心理学相应的术语的含义相通或在哪些方面与外国心理学尤其是西方心理学相应的术语的含义有所不同。

第八步，最后作一心理学上的界定，指明此术语在心理学上的确切含义，或者揭示出其内所蕴含的心理学思想。

综上所论，本书所讲的语义分析法是笔者在长期从事中国文化心理学的研究过程中逐渐提炼出来的，其名称虽与奥斯古德（Charles E.Osgood）及其同事所倡用的语义分析法（method of semantic differential）在中文字面意义上相同，但二者的英文名称、实际内涵、操作过程和性质都是不一样的。因为奥斯古德等人所倡用的语义分析法实际上是控制联想与计量的组合，用之来研究事物的“意义”的一种方法。在实施时，被试利用一些意义对立的成对形容词所构成的量尺，对一种事物或概念进行评量，以了解该项事物或概念在各方面所具有的意义及其“分量”。同时，语义分析法中的“分析”虽然与作为“思维的心智操作”的一个方面的“分析”在字面上是相同的，在含义上却有本质差异：前者包括了思维的心智操作中的分析、综合、比较、抽象、概括、建构等多种过程；后者仅指在思想上把整体分解为部分，把复杂的事物分解成简单的要素，逐一加以考虑的心智操作。

四、提高教育心理学科研能力的策略

如何才能提高自己进行教育心理学科研的能力？

（一）熟悉教育心理学的基本研究方式

在开始研究教育心理学之前，要根据自己的知识背景与研究主题的性质，选择一个适合自己的研究类型，切不可盲目跟风。教育心理学的研究方式虽然千姿百态，概括起来主要有三大类：

1.基础研究

基础研究是指以教育心理学中的一些基础性问题为研究对象的研究。它以解决教育心理学里的一些基础性问题为旨趣，一般不指向某一具体的教育问题或学习问题（即使指向了，也只是做理论分析或实证研究，一般不提具体解决方案）。一般而言，基础研究颇为适合拥有良好的理论思维或实证思维，且拥有充足的科研时间、科研精力和必要科研条件的专业科研人员。

从研究方法角度看，根据研究主题的实际情况，基础研究可以采用适当的研究方法，其中，最常用的方法是实验法与理论分析法。为便于读者理解，下面对其中的心理学理论研究作较详细的说明，教育心理学的理论研究可以参照它进行。

（1）心理学的理论研究的内涵与特点。

心理学的理论研究是指以建构心理学理论（微型、小型或宏观）或者提出某种理论观点为旨趣，以理论分析法为主要研究方法的一种研究类型。理论分析法是运用理论思维来揭示客观事物本身所存在的内在规律，或者，运用理论思维来建构反映客观规律的模型的一类研究方法。在建构理论模型时，若能善用“维度”的眼光，往往有意想不到的收获。心理学理论研究的显著特点至少有二：一是“有生于无”，即运用理论思维进行理论建构，最终能够产生新的学术思想或观点。所以，心理学的理论研究与心理学史研究的一个重要区别是：心理学史学研究的显著特点之一是“有生于有”。这里，前一个“有”指对史实所做的分析与评价，后一个“有”指史实，像司马迁写《史记》那样。二是理论研究所获得的成果一般具有浓厚的理论色彩，这是它区别于其他方法的又一个显著标志。

（2）建构心理学理论的常用方式。

建构心理学理论的方式多种多样。从理论分析法与实证法何者为先的角度看，建构心理学理论的常用方式有三种：①自下而上的建构。它是运用归纳法建构出自己理论的一种做法：先就某一心理学主题做大量的实证研究，然后运用理论分析法将实证所获丰富成果进行提升，使之上升为相应的理论。其优点是建构出来的心理学理论的科学性一般较强，因为它是本着“一分证据说一分话”的精神建构出来的；缺点是较难建构出宏观的心理学理论。按这种方式建构心理学理论的典型代表人物之一是斯金纳（详见第四章）。②自上而下的建构。它一般是运用演绎法建构出自己理论的一种做法：先运用理论分析法对某一心理学主题或多个主题进行系统的理论建构，从而构建出一个或一套心理学理论，然后再去寻求相应的证据予以支撑。其优点是便于建构出宏观的心理学理论；缺点是建构出来的心理学理论的哲学韵味一般颇浓，因为其常常缺乏足够的实证证据。按这种方式建构心理学理论的典型代表人物之一是弗洛伊德。③混合使用自上而下与自下而上两种建构方式。它一般综合运用演绎法与归纳法来建构自己的理论：先对某一心理学主题有初步的理论建构（理论雏形），然后寻求实证证据，在获得丰富实证证据的基础上，进一步拓展原先的理论雏形，将之建构得更加完善、成熟。按这种方式建构心理学理论的典型代表人物之一是皮亚杰（详情请见第三章）。

从理论与事实何者为先的角度看，建构心理学理论的常用方式有两种：①事后解释型理论：先有某种心理事实，然后建构一种心理学理论来对这一事实进行合理性解释。其优点是建构出来的心理学理论往往与其所要解释的事实是吻合的；缺点是，若理论的预测力不强，按此方式建构出来的心理学理论易招来“马后炮”的批评。按这种方式建构起来的典型心理学理论之一是英国物理学家杨（T.Young）于1807年左右首先提出的三原色假设，与1860年由赫尔姆霍茨（H.Helmholtz）在其基础上发展的三色说被后人合称为杨—赫三原色说（trichromatic theory）。②预测型理论：先运用理论思维对某一心理现象进行理论建构，从而构建出一个或一套心理学理论，然后再去寻求相应的证据予以支撑。其优点是便于建构出较系统、较宏观的心理学理论；缺点是建构出来的心理学理论往往只是一种“假说”，因为它常常缺乏足够的实证证据。按这种方式建构心理学理论的典型代表人物之一是弗洛伊德。

（3）心理学理论研究的价值。

心理学理论研究的价值至少有四：第一，为实证研究提出某种新的理念或新的假设。第二，整合、提升实证研究所获得的一些零散研究成果，使之上升到一个概括水平更高的层次，从而获得一个一般或普遍的结论。第三，提高研究者的理论思维。恩格斯说：“一个民族想要站在科学的最高峰，就一刻也不能没有理论思维。” 此话同样适用于心理学研究。如果一个心理学研究者不加强理论思维的训练，就只能在他人创造的理论框架下进行研究，不仅无法作出原创性大的研究，还易丧失自己的学术主体性。若中国的心理学研究者不加强理论思维的研究，只一味照搬外国尤其是西方的心理学理论，不仅永远无法超越西方的心理学，甚至有可能丧失中国文化的主体意识和中国文化自身的特色。第四，受制于研究手段的局限性等缘由，某些心理学问题暂时只能用理论分析法进行研究，此时理论研究就往往大有用处了。例如，若无法在真实实验情境里做实验时，可以运用思想实验进行研究；而要做好思想实验，自然要求研究者要有良好的理论思维了。

2.基础与应用相结合的研究

基础与应用相结合的研究是指对教育心理学中的某一问题既作了一定的理论分析又提出了一定的实施方案的研究。一般而言，基础与应用相结合式研究的理论概括程度较之基础研究要弱一些，但较之纯粹的应用研究，它也有一定的理论建构；其应用水平较之纯粹的应用研究可能要弱一些，但较之纯粹的基础研究，它又具有一定的应用性。

3.应用研究

应用研究是指以教育心理学中的一些具体性、可操作性主题为研究对象的研究。它主要针对教育或学习中出现的具体实践问题，考虑了影响它们的复杂因素，提出了切实可行的解决方案或对策（故对策研究属于应用研究中的一种），其研究结果对于解决同类问题具有较高的适用性或借鉴性。一般而言，应用研究颇为适合对教育一线情况非常熟悉且擅长动作思维的科研人员。

（二）准确把握撰写论文或著作的基本规范，并履行相应的伦理道德规范

有人会说，写学术论文就一定要弄成“八股”式的吗？这涉及“套路”与“观点”的关系问题。在这个问题上，合理的解答是：套路重要，观点更重要。一些研究者常有两类缺陷：一是全无章法可言，让人一看就是门外汉。从这个意义上说，书写论文的套路很重要，它本身就是衡量一篇论文是否合乎学术规范、质量是好是坏的重要依据之一。二是虽然已掌握研究的套路，但只知“依葫芦画瓢”。从这个意义上说，对于一切学术论文而言，提出新观点当然更重要。既然套路很重要，一项科研工作完成后，在撰写学术论文、研究报告或论著时，一般要按本学科领域约定俗成或正在通行的学术规范撰写，具体做法一般是：如果有明确的正在通行的学术规范，就遵照它执行；若没有，就依约定俗成的学术惯例进行。

1.完整论文的结构

一般而言，用中文完成的一篇完整的学术论文一般包括十六部分：论文题目、作者姓名、单位、摘要、关键词、引言、正文、结语、主要参考文献或注释、英文题目、作者的英文姓名、单位的英文译法、英文摘要和英文关键词、作者简介和联系方式。当然，如果论文不是用中文而是用英文写的，那么，中文题目、作者的中文姓名、单位的中文、中文摘要和中文关键词等部分可省略。

2.论文或论著的基本写作规范

第一，论文或论著的题目和文中各级标题要简洁明了（一般各级标题在字数上限定在20字以内），突出重点，不能拖泥带水。曾经有一个学生起初将其论文题目写成“师范大学的师范生与非师范生和非师范大学的师范生与非师范生的成就动机的比较研究”，长达38个字，显得过于拖泥带水；后来在笔者的指导下，该生将之改作“成就动机：师范生与非师范生的比较研究”，就合乎上述要求了。

第二，论点鲜明，且有理有据。因为学术文章与著作（尤其是人文社会学科领域的论文或学术著作）不怕标新立异，但要自圆其说。

第三，用词要得体、简洁，为了保证思想观点的客观性，在表达方式上一般用中性词表达，尽量不使用褒义词或贬义词。同时，用语务求精确，尽量不使用那些让人有较大想象空间的词语；若使用数学符号等符号，一定要做到书写规范。

第四，尽量用第三人称撰写论文或论著，少用或不用第一人称方式撰写论文或论著。

第五，若采用了实验法、测量法或问卷法，那么文章或著作就属实证型的，此时一定要按APA(美国心理学会）论文格式撰写，并且要将下列事项在文中交代清楚：研究假设、实验仪器或研究工具的选择与说明、被试的选择标准、被试的基本情况、实验设计与实验程序或施测程序、实验结果或数据统计结果、分析与讨论、结论。若有图表，一定要清晰、规范、准确。若运用了统计方法，那么文中各类统计表格宜做规范化处理，不能简单地仅从SPSS或其他相关软件里粘贴过来，更不能将“结果”等同于“结论”。“研究结果”仅是通过实验或施测后得到的数据，必须通过稍后的“分析与讨论”才能进一步明确其学术价值，由此才能得出“结论”。

第六，若是理论性文章或论著，一定要提出自己的“一家之言”，而不仅仅是“评析”；若能提出独到的术语、系统的观点、新颖的结构或做深刻的论证则属佳作。

第七，若是综述性文章，要做到：①材料全面而新颖。其中，“全面”的标准是看其是否有重大遗漏，而不是看其是否面面俱到。如果没有重大遗漏，就算“全面”。“新颖”的标准是：若是对某一“老主题”的综述，看其是否能收集到前人未发现的文献，若能收集到，则说明有新颖的材料；若是新进展性综述，看其是否有最近3～5年的参考文献，尤其是有无相关的英文文献，若能收集到，则说明有新颖的材料。②结构新颖，条理清晰。③观点鲜明，概括性强，有较强的可读性。④有客观、独到的评价，对后续研究有具启示意义的建议或构想。

第八，若是史学性文章或著作，要做到：①材料具有经典性、代表性和新颖性。②结构合理，且条理清晰；若能提出合理而新颖的结构则为佳作。③观点鲜明，概括性强，有较强的可读性。④有客观、独到的评价；当然，最好要有自己的思想观点。

第九，只要不是通过自己独立思考之后创造性（属真创造，而不是类创造）地提出的观点，都要注明观点的来源或资料的来源。若引用或参阅了别人的观点、方法、研究程序或材料等，更要详细标明出处。这样做，既便于他人的查找与核对，也是对原作者人格与著作权的尊重。同时，为了杜绝抄袭现象，切不可在论文或论著写作过程中使用如下四种常见抄袭手法：①“原封不动地整段搬迁式”。②“搅拌式”：将他人的话与自己的话搅拌在一起，便作为自己的话登场。③“组装式”：将别人文中或书中不同场合说的话组合在一起，然后作为自己的话示人。④“掩耳盗铃式”：“参见”中的“参”乃“参考”之意，“参见”就表明自己是独立进行了这番论述，与那本书或那篇文章没有渊源关系，而只是“英雄所见略同”。所以，原原本本地，或搅拌式地剽袭他人，却又做一个“参见”的注释，实为“掩耳盗铃”。

第十，参考文献要把握该主题的最新研究动态，为此，最好要有最近3～5年的参考文献。同时，参考文献或注释要规范。为此，至少要做到两点：一是所有参考文献或注释要按一定的顺序排列。参考文献常见排列顺序有三：依文中引用次序的先后排列、依文献出版或发表的时间先后顺序排列（若同时有两篇/部及以上论著在同一时间发表或出版，再按作者的英文字母或拼音字母顺序排列）和依论文或论著作者的英文字母或拼音字母顺序排列（若同一作者/团队有两篇/部及以上论著，再按发表/出版时间的前后排列；若同一作者/团队有两篇/部及以上论著在同一时间发表或出版，便在此时间后依次写上a、b、c……）。二是参考文献或注释要遵循一定的书写格式。现在常用的是APA格式，可参照当前《心理学报》或英文心理学杂志上的论文格式。认真揣摩，做到烂熟于心。

3.科研工作者必须遵守的伦理道德规范

科研工作者除了必须遵守所在国家或地区的道德与法律外，在科研过程中还必须遵守如下伦理道德规范：

第一，善待被试。若需以人作为被试开展研究，在正式开展科研之前，必须与被试签订知情意愿书，征得被试同意后才能进行研究，并避免在科研过程中伤害被试的身心。科研工作结束后，要诚心诚意地对被试表示谢意；若事先向被试许诺支付报酬的，一定要按时按量支付给被试应得的报酬。所有从被试那里获得的数据均要严格保密，绝不泄露给其他任何无关者（包括无关的个人或组织）；所有从被试那里获得的数据均只用于科学研究，绝不用作其他用途。若需以动物作为被试开展研究，在科研过程中要尽可能减少对动物的伤害，切不可以任何形式或借口虐待动物。

第二，遵循客观性原则撰写论文或著作，凡事要讲证据，做到“大胆假设，小心求证”（胡适语），有一分证据说一分话；既不主观“臆测”或弄虚作假，也不歪曲或隐藏事实。

第三，凡是引用或参阅了他人的观点、方法、研究程序或材料等，都要逐一详细注明出处，绝不能抄袭或窃取他人的科研思想或科研成果。

第四，按研究者的贡献大小决定论文或著作的署名次序，既不可“无功受禄”，也不可抹杀他人作出的贡献。

第五，遵守论文投稿规则，做到“一稿一投”，绝不“一稿多投”。

（三）善于做文献综述

在学术研究中，自己的正式研究开展之前的文献综述是一项重要工作。它的功能至少有三：①“为往圣继绝学”（张载语）。对于今人的很多研究主题，往往前人曾做过很多研究，其中不乏一些颇有见地或极有创见的研究。因此，后来研究者的一大文化使命就是，通过文献综述，将前人就此主题提出的精义见解发掘出来，使之发扬光大，代代相传，不至于淹没在历史的长河里。②为了做到“接着说”（冯友兰语）。通过文献综述，准确把握前人对此主题的已有研究成果的现状，有助于自己将要开展的研究做到“接着说”，避免“闭门造车”“从头说”（起点太低）或“胡说”。③避免出现重复性研究。在科技史上，华莱士（Wallace）与达尔文（Darwin）二人在没有相互交流的情况下几乎同时提出“进化论”的思想，其中达尔文秉持公正态度将自己与华莱士二人的研究成果同时公布一事被后人传为美谈。不过，那是科技史上的“幸事”。在今天资讯如此发达的情况下，一个人若关起门来做学问，即便是独自取得了与他人类似的研究成果，不但其科学性将大打折扣，而且极易招来“抄袭”的罪名。为了避免出现重复性研究，最好的做法便是事先做好文献综述。那么，怎样“做好”文献综述呢？

1.收集到尽可能全面的相关资料

当你将要做某一主题时，一定要善于运用计算机，利用种种数据库进行查找，将有关此主题的相关文献资料——如书籍（书籍类型：专著、编著、主编、译著、资料汇编等；纸质书、电子书等）与文章（文章类型：实验报告、理论性文章、史学性文章、综述性文章等；纸质文章、电子文章等）做一个尽可能全面的文献综述。在这样做时，常会遇到两个问题：一是如果基本收集不到关于某一主题的已有研究成果，该怎么办？这时就要反思：是不是自己用了一个生僻的术语？若果真如此，就赶紧用学术界常用的、与此主题类似的术语进行检索。是否真是自己发现了“新大陆”？若果真如此，就要有勇气、自信地坚持做下去，千万不要惧怕困难。二是假若收集到成千上万个关于某一主题（如自我）的已有研究成果，此时该怎么办？答案就是：继续做二次检索、三次检索……这样，就会不断缩小检索的范围。

2.挑选出其中具代表性的资料作进一步分析

通过初步检索所获得的大量文献资料，如何将之作进一步的有效整理与分析呢？这里的关键就是：挑选出其中具有代表性的资料作进一步分析，而不能“眉毛胡子一把抓”。那么，怎样在鱼目混珠的大量文献里挑选出具代表性的资料呢？这就有一定的挑选技巧了：一般而言，先挑选出一篇质量上乘的论文或一部质量上佳的著作，然后以此文或此部著作所列参考文献为线索作一追根究底式溯源。这是一种方便、高效、切实可行的做法，因为人们有理由相信以下假设是能够成立的：一个人如果能就某一主题写出一篇质量上乘的论文或一部质量上佳的著作，那么，此人对涉及此主题的、在其撰写此论文或论著之前的已有相关文献一定非常了解，且有相当的研究。

既然如此，怎样就某一主题挑选出一篇质量上乘的论文或一部质量上佳的著作？这就涉及评判的标准或方法。一般而言，灵活使用以下几种方法，一般是能够就某一主题挑选出一篇质量上乘的论文或一部质量上佳的著作的：①论文或论著的作者的声誉。一般而言，论文或论著的作者在某一专业领域拥有的声誉越良好，其撰写的学术论文或论著的质量也就越高；反之亦然。②出版社或期刊的质量（或声誉）。若是英文期刊，通常先看是否是SCI或SSCI，然后再用“影响因子”的高低进行衡量，影响因子越高，通常该期刊的声誉越佳。若是中文期刊，先看是否是CSSCI,CSSCI的整体质量较佳。若是出版社，则要看其声誉，若声誉越良好，一般其出版的学术著作的质量也就越高；反之亦然。③同行专家的评判。如果一个人既具备某一专业领域专家的业务水准，又拥有高尚的道德品质，那么，请此人对其擅长的专业领域的学术论文或论著的质量作一评价，其结论的信度与效度一般较高。另外，论著的“引用率”和获奖类型也是两个重要的衡量指标。就“引用率”而言，一般“引用率”越高的论著，其质量也越高。当然，也存在两个例外：第一，曲高和寡式。某论著质量高，可惜未及时得到同行的认可。第二，畅销书式。某论著的引用率虽高，却非研究质量高，而仅仅是话题吸引人或语言通俗易懂。就获奖而言，若奖项本身的公信度较高，那么获奖级别越高的论著，一般质量也越高。④自我评判。假若自己是某一专业领域的专家，也可对自己专业范围内的论文或论著的质量进行自我评判。

一旦你已就某一主题挑选出了有代表性的资料，接下来就要做两件事情：一是对它们作一尽可能客观而准确的概括；二是对它们作一尽可能客观而公正的评价。

3.做文献综述时宜注意的问题

在做文献综述的过程中，宜注意以下四个问题：

（1）要有权威性，忌遗漏重要文献以及重要观点、证据或方法。要将与研究主题有关的权威文献和代表性文献尽可能全面地收集到，不能遗漏重要文献，不能遗漏重要观点、证据（如数据）或方法，否则易得出失真的结论。鉴于“法乎其上，斯得其中；法乎其中，斯得其下。”为此，在参考文献中，若是已发表的论文，尽量引用属于SCI、SSCI和CSSCI期刊上的；若是未发表的论文，尽量做到只引用博士学位论文；若是书籍，尽量引用出自名家之手、才俊之手和新秀之手的。同时，参考文献须做到五个兼顾：①从语言上看，要兼顾中英文文献，在此基础上，若还能看懂并引用其他语种的文献更佳；②就中国发表的文献而言，要兼顾海峡两岸和香港，须知在很多问题上，中国港台地区的学者都有不错的研究成果；③就文献载体而言，要兼顾论文与论著，不能只检索论文，也不能仅引用几本教材敷衍了事；④就文献所用方法而言，除非是纯粹的理论文章或史学文章，一般要兼顾理论性文献与实证性文献；⑤就文献出版和发表的时间来看，一般要兼顾经典文献与最近5年内出版和发表的新文献。

（2）不能只讲虚名。无论是对论文或论著作者声誉的评判，还是对期刊或出版社声誉的评判，都不能只讲虚名，一切都要凭证据说话：论文或论著质量的好坏，说到底要看论文或论著本身的质量高低，不能为一切外在的因素所干扰。

（3）要有针对性，忌堆砌。撰写文献综述时一定要做到：只围绕自己选定的主题开门见山地撰写，不能将与研究主题关系不大或无关紧要的材料都堆上；否则，就不是开门见山，而是开门见万水千山，这易给人“字数不够，文献凑”的不良印象。

（4）要有述有评，忌“有述无评”或“述后胡评”。要对已有文献所取得的学术成就与存在的不足作一个尽可能客观而精确的概括与评价，进而寻找自己研究的突破口，千万不能“有述无评”或“述后胡评”；否则，很难保证自己的研究能够做到“接着说”。

（四）提高自己的学术修养

“工欲善其事，必先利其器。”要想提高自己从事教育心理学科研的能力，说到底，必须想方设法提高自己的学术素养。

1.至少具备四个方面的学术素养

一般而言，要想成为一名合格的教育心理学领域的研究者，至少要具备如下四个方面的学术素养：

一是较扎实的国学功底，并要“进得去，出得来”。“中国文化”是影响中国人心理与行为的重要因素之一。一个人若想在自己的教育心理学研究里妥善处理好“中国文化”这一变量，既不是简单地引一段或几段古文就可以做到的，也不是简单地将“中国文化”作为一个变量考虑就可以的，而必须具有较扎实的国学功底，并做到“须入乎其内，又须出乎其外。入乎其内，故能写之。出乎其外，故能观之。入乎其内，故有生气。出乎其外，故有高致” 。

二是较扎实的西方哲学和西方教育心理学功底，也要“进得去，出得来”。现代教育心理学诞生于美国，并且主要是在以美国为代表的西方发达国家中获得了长足的进步。因此，当代教育心理学无论是在研究理念、术语或理论模型，还是在研究方法或研究主题上，都深受西方哲学和西方教育心理学思想的深刻影响。自然而然地，一个后学者若想将来能够有效开展教育心理学的研究，就必须具备较扎实的西方哲学和西方教育心理学的功底，进而对西方哲学和西方教育心理学的发展历史、现状与未来有深刻的领会与把握。当然，与对待国学类似，对待外国尤其是西方的科学哲学与心理学，也要有“进得去，出得来”的心理素质。

三是既有较强的理论分析与建构理论的能力，又有较熟练的实证功夫。综观心理学（包括教育心理学）的发展历史，大凡大师级的心理学家，像巴甫洛夫、维果斯基、皮亚杰、华生、柯尔伯格等人，往往既有深厚的理论修养，又善做精巧的实证研究，从而能将理论研究与实证研究有机地统一起来，在实证中提升、完善自己的理论体系——他们往往基于自己的理论假设，设计出一套套精巧的心理实验、一套套精巧的问卷调查或心理测验等，用以验证自己的理论假设，并在这相辅相成的过程中成就了一番心理学事业。鉴于此，一个志在研究教育心理学的人也应该通过多方努力，尽快使自己拥有这两方面的科学素养，因为就教育心理学的科研而言，“理论分析与建构理论的能力”和“实证功夫”犹如鸟的两翼，缺一不可。

四是要有较优秀的人格素质。无论是“单干”还是进行“团队攻关”，一个人若想成为一名合格乃至优秀的教育心理学研究者，就必须通过修身养性与道德学习等途径，逐渐使自己具备自尊、自信（包括对中国文化的自信）、自觉（包括对中国文化的自觉）、自强、有责任心、自爱爱人、公平公正、见利思义、谦虚谨慎、善于独立思考、性情乐观、意志坚定等方面的优秀人格素质。

2.有效提高学术素养的做法

如何才能有效提高自己的学术素养呢？切实可行的做法至少有以下三种：

第一，通过道德学习与修身养性的方式提高自己的道德修养或人格修养。此条一点就明，就不深究了。

第二，按“六度”标准提高自己的知识（认知）素养。“六度”指知识的高价值度、知识的高度、知识的深度、知识的广度、知识的精度与知识的新度。这在后文第十一章有详论，这里也不多讲。至于获得符合“六度”标准知识的方法，概括地讲，主要有六个要点：①通过多看、多听、多读、多记、多思的方式不断拓展知识的广度；②采取多种手段不断提高知识的价值度，以便获取知识的最大价值；③通过高屋建瓴地看、听、读、记和思的方式不断提高知识的高度；④通过深度阅读、深度思考、深度推理的方式不断推进知识的深度；⑤通过严谨而仔细地看、听、读、记、思的方式不断提高知识的精度；⑥通过平日注意跟踪本学科的最新发展动态来不断提高知识的新颖度。

第三，通过持之以恒的实践来提高科研能力。俗话说：“实践出真知。”在日常生活里持之以恒地坚持学术研究，自然是提高自己的科研能力的一种好做法。正如黄希庭所说：“科学研究贵在坚持，不能‘放一枪就跑’。只要思路对头，方法合理，持之以恒就有可能有所发展，有所成就，在该领域取得领先的地位。” 当然，为了提高实践的效率，可以分三个阶段依次推进：①“无批判性继承”。具体做法是：按前文所讲做文献综述时的做法，先挑选出一篇质量较高的学术论文，然后仔细阅读，使自己熟悉科研的一般套路。进而以它为师，亦步亦趋地完全照着它做，“依葫芦画瓢”，不作批判性选择，只求完全复制“老师”的心路历程、生活方式和科研方式。②“复演”。按照从“老师”身上学到的东西原汁原味地重复演练，做到整个过程不走样，水准向老师看齐。③“改良或优化”。对“老师”的整个心路历程、生活方式和科研方式完全掌握并烂熟于心后，再根据自己的经验和科研实际进行改良或优化，最终作出创新性成果。

第三节 怎样研究教育心理学

一、教育心理学的基本研究过程

二、两种研究类型与两类研究方法

三、科学选择具体的研究方法

四、提高教育心理学科研能力的策略

第三节怎样研究教育心理学