



特殊儿童教育评估所使用方式甚多,若依测验的正式性,则可分为使用正式测验与未使用正式测验二种。
所谓正式的评估工具,指的是标准化的、常模参照的评估工具,此种评估工具,可将评估结果化成各种标准分数或常模分数,以了解受试者在团体中的相对地位,测验所得分数的意义亦依其在团体的相对位而定。就特殊教育的历程而言,鉴定或特殊教育资格认定,大都采用标准化评估工具作为判断依据。此类测验通常可以在出版社的网站查得相关信息,特殊儿童评估的专书通常也会对各测验加以介绍
。
标准化的测验工具,可依其在特殊儿童评估的功能作以下分类。
智力测验的目的在于评估儿童的智力功能,在鉴定上可用以决定儿童是否符合智力障碍、智能优异的鉴定标准。学习障碍、智力障碍、一般智能资赋优异等类别儿童的鉴定,皆需应用智力测验。在教学上可用以决定儿童的学习表现是否受其智力功能影响,或决定其学习表现是否符合智力水平,用以判别儿童是否为低成就者。用于鉴定的智力测验通常为个别智力测验(一次只对一个学生施测),其中以韦氏儿童智力量表(WISC-Ⅳ)最为常用。
认知能力测验的目的在于评估儿童认知历程的各项能力,例如注意力、记忆力、推理能力、知觉能力、认知速度等。此类测验可能为单一能力的测验工具,例如记忆力、视知觉能力等测验;也可能是整体智力测验或认知能力测验其中的分测验,例如韦氏儿童智力量表中的记忆广度分测验。由于目前并无认知障碍或认知优异的特殊儿童类别,因此此类测验的目的通常用于辅助鉴定,了解儿童是否具有特定认知能力缺陷,但并非主要的鉴定工具。
创造力也属于认知能力之一,资赋优异学生其中一类为创造能力资赋优异,因此,此类学生的鉴定即需使用创造力测验。此外,一般能力资赋优异、学术性向资赋优异、艺术才能资赋优异等类别学生的鉴定,也可能使用此类测验,用于了解儿童的创造能力,以作为鉴定的参考。
虽然智力测验有时也被称为学术性向测验,不过,二者仍有区别,前者通常用以评估一般的或综合的认知功能,且尽可能不涉及学校的学科领域课程;后者,则主要在于评估学生的学科领域学习潜能,其内容虽非直接取自学校的学科领域课程,但其题型、能力,却与学科领域学习较为接近。此类测验可用于学术性向资赋优异学生的鉴定,也可作为一般能力资赋优异学生鉴定的辅助工具,此外,亦可发展艺术性向测验,鉴别艺术潜能优异学生。
“学业能力”测验内容通常并非直接取自学生在校日常学习的课程内容,例如识字、阅读理解、口语理解、口语表达、书写表达等测验;“学业成就”测验的内容则直接取自儿童在校学习的课程内容,例如语文科、数学科等学业成就测验。此类测验可用于评估儿童的整体或特定学业领域(例如整数乘法、分数计算)的学习表现。智力障碍、学习障碍、学术性向资赋优异学生的鉴定皆可能使用之。教师也可能使用此类测验评估学生的学习表现。另外,有些测验针对学业学习策略加以评估(例如整体学习策略、阅读理解策略、写作策略等)。
语言能力测验通常用于评估儿童的构音、拼音、语音、语法、语意、语用、语言沟通等能力。语言障碍儿童的鉴定与教学,最可能使用此类测验,此外,学习障碍儿童、听觉障碍儿童的鉴定与教学,也可能使用此类测验。
情意与行为测验通常包括人格测验、人际关系或社会技巧测验、情绪或行为困扰测验等。此类测验最常用于情绪行为障碍学生的鉴定,例如使用情绪障碍量表、行为与情绪评估表,以了解儿童是否符合情绪行为障碍的鉴定标准。或使用注意缺陷多动障碍量表、自闭症量表等测验,以了解儿童是否属于该类障碍。
智力障碍鉴定需同时具备智力明显低下与社会适应明显困难等双重条件,因此,社会适应量表最常应用于智力障碍学生的鉴定。此外,此类测验也可用于情绪行为障碍、自闭症等儿童的辅助鉴定工具。儿童发展量表通常应用于学前幼儿的筛选与鉴定,了解幼儿整体或特定领域的身心发展有否迟缓现象。
使用非正式的评估工具,虽较无法有效判断学生在团体中的相对地位,但却可使评估结果与教学相结合。此类测验通常为教师自编测验,或使用实地调查、观察记录、作品分析等方式进行评估。未使用正式评估工具的评估流程,有时也称为替代性评估,其具有以下多种评估方式。
观察法即借由观察者搜集学生的行为表现信息,以作为教育决策参考的评估方法。就观察的情境而言,观察法可分为实验情境观察与自然情境观察两种。为在较短时间内获得完整的行为信息,评估者常需采用模拟情境以观察儿童的行为反应,例如在教室的模拟情境中,观察儿童的购物行为、挫折反应等。不过,模拟情境不同于自然情境,因此,若能再配合自然情境的观察,则更有利于了解儿童在真实生活环境下的行为表现。访谈法则借助儿童重要关系人的观察结果与回忆,而非评估者的亲自观察,虽然准确性可能较低,但可以节省许多人力物力。不管观察或访谈,也都会配合使用一些检核表、评定量表、访谈提纲。
行为功能评估的“功能”有二层含义,其一为函数,其二为目的或手段。函数意即行为与环境的因果关系(例如天气热导致儿童上课难以保持专注);目的或手段意即行为所欲达成的目的(例如儿童以哭泣来逃避学习或获取强化物)。行为功能评估也称A-B-C分析法,A(antecedents)指行为的前置条件,B(behaviors)指行为本身,C(consequences)指行为的后果。此评估模式的目的在于了解儿童行为问题的前因与后果,借以调整环境、指导积极的替代行为、改变行为的后果条件等,以处理儿童的行为问题。
教师可采用观察、访谈、行为因果假设验证等方法,进行行为功能的评估。有效了解行为的功能与其应对策略,目标行为的界定需符合明确、可观察、可量化、可处理等条件,而非仅是模糊的概述或人格批判。例如“在午餐桶里吐口水”即较“不遵守用餐规范”或甚至“用餐时调皮捣蛋”,更符合行为功能评估的要求。
行为功能评估经常与积极(正向)行为支持(positive behavior support, PBS)并用,最常应用于评估学生的行为问题,找出行为的可能原因并据以处理。读者可以参阅本章所提供的参考文献,并实际找一个具有情绪行为问题的学生,观察及评估行为功能,以练习行为功能评估的实际应用。
1.徐胜、孙涛.积极行为支持对自闭症儿童课堂干扰行为的个案研究[J].重庆师范大学学报(社会科学版),2020, 4∶77-85.
2.杨春英.积极行为支持干预对轻度听力障碍儿童攻击行为的个案研究[J].郑州师范教育,2021, 10(2):69-73.
3.王辉.特殊儿童教育诊断与评估[M].3版.南京:南京大学出版社,2020,325-337.
课程本位评估即课程内容与评估内容相结合的评估方式。此种评估方式通常皆先确定整体的课程内容,然后以此内容作为教学与评估依据,借以决定教学起始点。教学后,亦以此课程内容作为评估学生对此课程内容的学习成效。此评估方式采用标准参照的评估模式,着重于确认学生表现是否达到既定标准或精熟水平,而非了解学生表现在常模参照评估模式中的团体相对地位。
由于课程本位的评估方式,其评估内容就是教学内容,极有利于教师确定学生教学前的起点行为及教学后的学习成效,因此,其亦被视为最能使评估与教学相结合的评估方式。课程本位评估常采用具有相同难度的题目内容,对儿童作持续性的评估,以了解其是否循进步曲线而逐渐接近学习目标。例如教师自教学材料的200个字中,每次抽取其中20个字作为教学及评估内容,并依10次评估流程,评估儿童对此200字的认读、书写、语意了解等学习表现,是否逐渐累积达成教学目标。
广义而言,凡评估内容与课程内容充分结合,有助于了解学生对课程的学习进步情况以作为教学调整的依据者,皆可谓课程本位评估,但实施方式也有不同形式,有的课程本位评估即采较为标准化的课程本位测量模式,包括课程内容、评估内容、评估过程、进步趋势曲线等,皆较标准化及较具信效度,而评估次数也更频繁,评估结果更能严密监控儿童的学习进步情况,因此,有时也被称为学业温度计
。
生态评估的“生态”意指环境中各因子间的互动关系,因此,生态评估重视了解学生所处生活及学习环境及环境中各相关因素间的交互作用。此评估模式有几个主要观点:①学生的学习及行为表现深受环境中各种互动因素的影响,许多学习问题或行为问题是环境不当所致,而非学生本身的问题;②若未同时处理环境的互动因素,则教学及行为干预其效果皆仅是短暂的;③教学内容及教学方法皆应考虑与学生所处生态环境的配合及实际环境中的应用;④特殊教育的目的在于培养学生适应环境的能力,因此,需评估学生适应其生态环境的困难、所需具备的能力及环境本身所需的调整,作为教学计划的依据。
动态评估以认知的“鹰架理论”为基础。“动态”有两层意义,其一为重视评估者对受试者的提示或指导,其二为强调受试者的表现会因接受教导而改变,教学后的进步幅度或作出正确表现所需协助的大小,也代表受试者潜能的高低。学习潜能高者,在教学过程中获益较大、所需教师提示的程度较小。最常用的动态评估模式为“渐进提示系统”,即依学生所需提示的大小来判断其潜能高低。动态评估重视的并非学生目前的学习表现,而是教学指导后的学习表现,或教学前与教学后学生表现的差距,此一差距也称为“最近发展区”,差距越大代表潜能越大。相较于静态评估只评估学生目前的成就表现,动态评估更有利于了解学生学习新事物的潜能高低。
档案评估重视儿童平时表现资料的搜集与汇整,借由儿童实际表现的汇总,了解其能力现况或进步情形。例如学习障碍儿童的鉴定或教学成效评估,除标准化测验外,若能再搜集平日的测验卷、作业单、日记、学习历程记录、教师与家长访谈等,在对各项信息的综合分析后,更有利于对儿童的障碍性质或进步情形作出正确判断。另外,有些领域难以使用标准化测验进行评估,也适合应用档案评估。例如艺术领域,借由各种竞赛、展演、检测、修习经历、推荐等资料,即可了解学生的艺术能力现况或进步情形。
实作评估即借由观察受试者实际进行某一任务,以评估其能力现况。此类评估最常应用于与动作或技能有关领域的评估,例如音乐、美术、舞蹈、戏剧等艺术才能的评估,或购物、如厕、洗衣等生活适应技能的评估。实作评估也可应用于学业学习领域的评估,例如教师观察儿童朗读、写字、写作、数学计算、生活中数学问题的解决等实际作业过程,评估其语文、数学能力。
真实评估意指评估情境、评估内容、评估过程,皆与真实生活情境符合,评估所测得的能力也是实际生活中所需应用的整体能力(例如真实情境中以书写方式与他人相互沟通的能力),而非某一或某些单一的、单纯的或抽离的特定能力(例如语法正确性、拼字正确性)。越具生活情境的真实性,即越接近真实评估的概念。真实评估与实作评估、档案评估的概念类似但仍有差异,例如儿童在模拟情境中的购物技能表现、各项音乐比赛成绩,属于实作评估或档案评估,但由于评估情境皆非真实情境,因此,仍非真实评估。
评估方式的真实性方面,例如要求儿童读一段真实报纸的文章后,给予选择题式阅读理解测验,则评估方式仍非真实生活的阅读能力表现方式。真实生活中,人们评估能否理解报纸内容,会针对报纸内容作内容重述或口语问答,而非选择题型的阅读理解测验。
工作样本分析即根据学生从事或完成某项工作样本的过程或优劣点,评估学生的能力现况及作为教学的参考。其分析方式可分为着重历程分析与着重结果分析两种。前者重视儿童执行某一工作或任务所需的能力,及其从事此一任务的历程所表现的各项能力优弱。例如写作能力方面,观察儿童自教师揭示写作题目起至其完成写作内容,在此一历程中所表现的能力;后者则重视学生已完成作品的分析(例如作品、作业簿),或已完成的任务的分析(例如折好衣物、刷完牙),了解学生完成此一作品或任务的优弱势或对错。在学业的样本分析方面,教师亦可分析学生已完成的作业内容,评估其学业表现。例如分析学生写作样本,以了解其语意、语法、语形、段落、结构、标点等能力及错误类型。
教学干预法借由儿童教学干预后的改善情况,评估儿童的学习或行为问题是来自教学、环境的问题或能力的缺陷。例如某一具有行为问题或学习困难的儿童,若经由采用实证研究验证有效的干预后,其行为或学习问题即获得明显进步,则该儿童的问题即为教学或环境因素所致而非能力缺陷;相反地,干预效果不明显者,才属于情绪行为障碍或学习障碍。《美国残障者教育促进法》(the Individuals with Disabilities Education Improvement Act,IDEA 2004)所订的RTI(Response to Intervention)学习障碍“干预反应”鉴定模式,即采用教学干预反应模式评估儿童的学习困难是属于教学不当或能力缺陷,若为能力缺陷才符合学习障碍的鉴定标准。