对某一事物进行分类是一个十分复杂的问题,究其原因主要有两个:第一,根据不同的标准,可以分为不同的类型,而标准是无止境的。这就说明,分类问题,由于其标准的无止境,是一个永无止境的过程。第二,类别之间总是或多或少的重叠部分,这一方面源于语言自身的特点,另一方面源于概念内涵与外延的杂乱交织。
因而,我们对英语语言能力测试进行分类,必须建立在以下两个方面的基础之上:第一,标准的选择必须有意义,有必要。无意义、无必要的分类在此不进行探讨;第二,分类限定在一定范围的大类之上,而对于范围较小的局部分类则不予涉及。
遵循上述两点的分类指导原则,根据不同的分类标准,我们将英语语言能力测试分为以下几个主要类型。
按学习阶段的不同,英语语言能力测试可以分为以下几种类型。
编班测试(placement tests)。这里首先要明确一个问题,即翻译上的误解。英语中placement的含义更倾向于一种“定位”,具体到语言教学中,指的是确定学生的知识水平。因而,这一含义与汉语的“编班”有一定的区别,容易让人误解为“分班”,如果翻译为“定位”则可以避免这种误解,但英语语言能力测试研究者似乎已经习惯于这种说法,因而本书我们也沿用这一说法。编班测试更通俗的说法是“摸底考试”,一般发生在新学期开始,新生入学之初,学校组织一次摸底考试,目的不同于升学考试,不在于选拔或者达到资格,而是通过测试掌握学生的知识水平,考查学生的整体能力,因而这样的测试的设计必须全面,难易坡度明确,以拉大学生的成绩差别。通过分析学生成绩的特点,制定有针对性的教学计划,完善教学资料或教学技巧的不足。
随堂测试(classroom tests)。这里仍然需要纠正一个通常的误解,即将随堂测试理解为必须是一堂课结束后进行的小型测试。实际上,所谓随堂测试,强调的是学习阶段上的随堂测试,也就是说,它强调两个方面:其一,它强调时间。即发生在编班至期中、期中 4 期终两个阶段之间;其二,“随堂”,即测试必须发生在课堂之上。至于测试发生在本节课结束时,还是发生在下一次课开始时,抑或发生在几节课完成后的课堂测试,都是可以的。随堂测试具有以下几个特点。
(1)随堂测试由于时间短,所以分量相对比较小。
(2)随堂测试由于相对较随意,因而测试形式不固定,有时可以是试卷,有时是黑板板书,学生提交答案等。
(3)由于课堂内容丰富,不同课堂之间教授材料不同,因而测试的题较多变,内容也多变。
(4)随堂测试由于是对学生刚刚学过的知识进行测试,所以测试内容以课堂讲授内容为限,不宜过难。
期中测试(mid-term tests)。这一类型的测试是与现实的学校学期设计有关的。一般学校会在学期到中间时期,会停课一周左右时间,进行一个正式的测试,测试的目的是对学生前半学期的学习情况进行系统诊断。这一测试也有利于弥补随堂测试的孤立、知识点单一等缺点。通过这样一个系统的测试,对已经学习的知识进行知识点之间系统的测试。学生在心理上也可以有一个系统的思考,以把握自己前半学期总的缺陷与不足。因而,设计的题目应当在这方面进行考量。
期末测试(end-of-term tests)。这一测试与期中测试相类似,都是与现实的学校学期设计有关。但是,不同的是,期末测试考查的范围更广、考试时间更长、考查的分量更大。一般来讲,期末测试有以下三个目的。
(1)促使学生巩固一学期已经学习的知识。
(2)评价一学期的教学效果。
(3)为下一学习的教学计划做准备。
由于以上目的,期末测试与前面的三种测试相比,通常更加受重视。在大部分学校,都将期末测试作为评定学生知识水平的标准,作为其他一些评比的依据,例如奖学金的评比,优秀学生中学习成绩方面的依据等。也正因为如此,学生对期末测试的重视较其他测试也较多。
按照测试用途或者目的的不同,测试可以分为以下四类。
成绩测试(attainment or achievement tests)是针对学生已经学习的知识进行考查,它一般依据一定的教学大纲,遵循一定的理论规律。上面讲到的随堂测试、期中测试、期末测试都是水平类型的测试。我国高考中的外语测试、针对大学生的大学四、六级测试,严格地说,都是水平测试。
水平测试(proficiency tests)并不是针对学生已经学习的知识进行考查,与过去的教学内容与学习方式也没有直接的联系。它旨在考查学生的语言综合能力,例如美国的托福考试、(TOEFL)、英国的剑桥英语水平证书测试(University of Cambridge Certificate of Proficiency in English)、雅思考试(IELTS)。我国各种类型的英语职称测试、各种上岗测试等,都属于水平测试。
潜能(素质)测试(prognostic or aptitude tests)的目的在于把握学生学习某种语言的潜力与天赋,以明确学生应不应该学习某一语言,或者学习某种语言所要付出的努力。既然是对一种潜能的测试,那么它就不会基于某一大纲,或者事先给定某一考查范围。因而,区分潜能测试与水平测试的依据也在于这一点。
卡罗尔(J.Carroll)和萨本(S.Sapon,1958,1967)设计了MLAT(Modern Language Aptitude Test),皮斯里尔(Pimsleur)(1964;1966)设计了PLAB(Pimsleur Language Aptitude Battery)。这是现有的著名的语言潜能测试模型。MLAT与PLAB测试的内容不完全相同。具体来说,MLAT主要考查四种能力。
(1)语音编码能力。
(2)语法敏感性。
(3)归纳式学习能力。
(4)机械记忆能力(后来被取消)。
而PLAB主要考查以下三种能力。
(1)言语职能。
(2)学习动力。
(3)听觉能力。
诊断测试(diagnostic tests)是针对成绩测试而言的,成绩测试关注的是学习成功的程度,而诊断测试,从某种意义上讲,更侧重于对失败程度的分析,通过这样的分析,以改进教学、调整教学计划、完善教学方法。因而,此类测试可以是单项,也可以是综合性的。前面讲到的编班测试就是诊断类型的测试。
需要指出的是,在现实生活中,以上四类测试的界限并不是十分清晰。有些考试同时具有两种以上测试的性质,而主要是以一种测试的特征呈现出来。另外一个特征是,针对不同专业的学生,同一测试具有不同的测试类型交集。以我国每年全国硕士研究生入学考试中的英语测试为例:由于硕士入学必须要求具备一定的英语知识水平与能力,因而必须对学生是否具备这一能力进行考查,从此种程度上讲,它是一种成绩测试;但是,如果是英语专业的学生,那么这同一测试的测试类型可能就会有一定的变化。对于英语专业学生,硕士入学考试在测试成绩的基础上,还有另外一个目的,就是测试考生的学习语言的天赋与潜能,因而从这个意义上讲,它是一种潜能(素质)测试。
根据评分方式的不同,英语语言能力测试可以分为主观性测试(subjective tests)和客观性测试(objective tests)。
海宁(2001)对主观性测试的定义为:
A subjective test is said to require scoring by opinion-ated judgment,hopefully based on insight and expertise.on the part of the scorer.
主观性测试的优点表现在以下两个方面。
(1)命题成本小。
(2)对考生的能力考查较准确,学生通过猜测性获得正确答案的成分小。
同时,主观性测试也有其缺点,体现在以下三个方面。
(1)很难确定正确作答的统一标准,评分较麻烦。
(2)受阅卷人员主观因素影响较大。
(3)考查的语言现象有局限性。
海宁(2001)对客观性测试的定义为:
An objective test is said to be one that may be scored by comparing examinee responses with an established set of acceptable response or scoring key.
客观性测试的优点体现在以下几个方面。
(1)答案固定,评分标准较统一。
(2)阅卷成本小,节约人力、物力和时间。
(3)受阅卷人员主观因素影响小。
(4)考查的覆盖面较大。
客观性测试的缺点主要表现在以下两个方面。
(1)存在不少猜测成分,对学生的语言能力的测试不准确。因此,客观性测试越来越多受到英语语言能力测试者的反对。但是,由于社会发展逐渐向高效率、快节奏发展。客观性测试虽然存在这样的缺点,在当今社会,仍然十分盛行。
(2)客观性测试的另外一个缺点在于命题难度较大。以单项选择题为例,命题者必须对题目的设计有明确的认识,包括常规、干扰项与答案项的设计。既不能使得考生通过非知识性技巧进行排除以获得正确选项,亦不能设计难度过大,超出单选题分数承载的知识量信息。
可以看出,主观性测试与客观性测试的主要区别在于,测试结果或者分数评价的标准的不同。一般认为,主观性测试需要评卷人员对考生的作答做出自己主观的判断;而客观性测试不需要评卷人员掺入主观的因素。
一般来说,在英语语言能力测试中,名词解释、简答题、论述题、作文、翻译题以及口试等都属于主观性测试;而选择题,包括单项选择题、多项选择题以及其他变式选择题都属于客观性测试。
但是,这里仍然需要明确两个问题。
首先,这里所说的主观与客观,针对的是评卷人员,更具体地说,是针对评卷人员在阅卷过程中,对考生作答的内容是否进行主观的判断,是否经过一个自己内心主观的评价,而不是指测试本身是主观还是客观。因为,从本质上讲,无论是主观性测试,还是客观性测试,测试本身内容的来源都是命题者的主观心理,即都是一种主观过程的结果。
其次,这里的主观与客观,并不是完全意义上的主观与客观,而只是一种相对的指示性言语。我们这里讲的客观性测试,也并不是说评卷人员在评阅客观性试题时,都不能存在任何的主观判断。事实上,评卷人员在陪你过阅试卷过程中,总是受主观思维的主导,哪怕他批阅的对象是一些客观性试题;同样地,评卷人员在批阅主观性试题时,也并不是不涉及客观的标准。实际上,他总是受到评卷标准等一些客观标准的影响。
根据应试者的测试行为与人们实际运用中的行为的相似性不同,英语语言能力测试可以分为直接测试(direct tests)与间接测试(indirect tests)。
休斯(Hughes,2000)认为,直接测试要求考试直接运用被测试的技能或能力。也就是说,测试者为应试者提供近似于真实的语言运用环境,要求应试者直接进行类似于真实的语言运用,以达到测试的目的。
直接性测试侧重于考试形式以及考试内容与现实环境的近似性;比如在口试中,测试者通过近似现实的对话性测试,以考查应试者的语言口语能力;也正因为如此,直接性测试具有较明确的测试目的。
休斯(2000)认为,间接测试与人们的交际语言运用行为无关,是用非直接的方法考查应试者的语言能力。
间接性测试并不侧重考试形式与内容与现实的近似性。比如多项选择题、正误判断题。测试者根据应试者的测试成绩,推断应试者的语言能能力。
正是因为这一推断的存在,我们也可以说,直接性测试与间接性测试的分类标准也可以是应试者语言能力是直接被考查还是通过推断获得。如果是直接被考查,则是直接性测试,如果是间接地被推断,则是间接性测试。
根据测试结果的解释方法和使用目的的不同,英语语言能力测试可以分为常模参照性测试(Criterion-referenced tests)与标准参照性测试(Norm-referenced tests)。
所谓常模参照性测试是将同一次测试的结果,根据某一特定的等级序列进行排序,并据此确定通过测试的合格分数线,高于此分的为通过考试,低于此分的为未通过测试。在此种测试中,应试者所得分数本身没有太大的意义,不能说明其具有的语言能力的高低。测试者以一组的形式出现,他们的分数确定他们在同组中的地位。学过语言学的人都知道,索绪尔在探讨词语的含义时,强调意义存在于与其他事物的比较之中,这里也是,某一特定应试者的分数的意义,存在于与同组其他应试者分数的比较之中。通常,在一个标准化的测试中,我们可以为其建立常模,即应试者在历次测试中的成绩,用标准分与平均分进行表示。然后,通过标准差的概念,确定一个特定的应试者的分数与平均分的距离,以确定其在整体分数中的位置。测试者一般根据现实的需要,设定一个通过测试的比例,比如10%。最典型的常模参考性考试就是托福考试。
准则参照性测试与常模参照性测试不同。具体来说,它测试的是应试者的特定知识或能力。它以事先设定的标准为依据。测试的目的在于检验应试者是否达到这一预先设定的标准,而对应试者彼此的分数则在所不问。更通俗地讲就是,应试者之间不具有竞争性,而只需满足标准的要求就可以。最典型的准则性参照标准测试是雅思考试。
除上述分类之外,英语语言能力测试还存在其他的分类方式。例如,根据测试内容方式的不同,可以将英语语言能力测试分为分离式测试(discrete-point tests)与综合性测试(integrative tests);根据测试的知识与能力的不同,可以将测试分为速度测试(speed or speeded tests)与强度测试(power tests)。对于这些分类方法,这里我们不再一一赘述。