本研究的理论来源有两方面:一是以公共产品理论、教育公平理论、教育生产函数为代表的教育质量发展理论;二是以控制论、信息论、系统论核心要点为基础的教育监测理论。
公共产品理论最早由美国经济学家萨缪尔森在其1954年发表的文章《公共支出的纯理论》中提出。萨缪尔森将产品分为私人消费品和集体(公共)消费品,并认为“公共品是指那种不论个人是否愿意购买,都能使整个社会每一成员获益的物品。私人品恰恰相反,是那些可以分割、可以供不同人消费,并且对他人没有外部受益或成本的物品”。萨缪尔森认为,纯粹的公共产品或劳务具有与私人产品或劳务显著不同的三个特征,即效用的不可分割性、消费的非竞争性和受益的非排他性。基于这三个特征,公共产品的供给往往是政府的责任。因此,高等教育作为一种制度化的纯公共产品,要实现其质量发展必须依靠政府的制度设计和政策安排,政府也必须强化高等教育质量发展的责任。
教育公平是社会公平的基础。教育公平是当今世界范围内教育理论与教育决策的一个核心问题,包括教育权利平等和教育机会均等两个基本方面。对教育公平概念的理解,欧美学者较公认的观点是由科尔曼和胡森提出的起点平等、过程平等和结果平等三个层面。我国学者一般认为,“教育机会均等”作为教育社会学研究中的经典性课题之一、教育发展和改革的目标之一,有三层含义:(1)入学机会均等,或入学不受歧视;(2)受教育过程中的机会均等;(3)取得学业成功的机会均等,标志是社会保证每个社群的子女在各级各类教育中所占的比重,与其家长在总人口中所占的比率大致相等。世界范围内比较通用的衡量教育公平的指标有两套,一套是金融视域下的教育公平指标,主要有教育投入、入学率、教育效率和教育成果等;另一套是以人类发展为导向的教育公平指标,主要包含人类发展指数、增加教育支出、识字率和性别发展指数等。
从教育经济学的角度来看,学校教育也是一种有投入和产出的生产活动。学校主要以学生学业成就及其他有价值成果的形式生产教育产品,为此,学校需要教育设施、设备、教学仪器、教师、教辅人员和管理人员。教育生产函数的理论和方法可以帮助人们理解教育生产过程,解释学校产出中所表现出来的差异,有利于深刻理解教师特征及教育物质上的支出对学生个人表现所产生的预期影响,有助于政策制定者决定是否要增加生产率较高的投入的供应或者是减少或稳定生产率较低的投入的供应。
控制论、信息论、系统论共同构成当代横跨多学科的综合性科学,也成为高等教育质量发展监测机制的理论基础。高等教育质量发展监测运用系统论和控制论的思想和方法,可以使高等教育质量发展监测者清楚地看到高等教育发展系统内外相互制约、相互影响的因素和变量,考察高等教育质量发展的整个过程,从而根据实际需要做出正确合理的控制与协调,以满足政府和人民群众对教育公平的不断追求。高等教育质量发展监测者和教育行政管理者通过对高等教育质量发展系统的整体把握,“能居高临下全面完整地考察教育系统,考察教育系统内外各种因素、各个方面,包括社会政治、经济、科技发展对人才的需求,包括教育政策、教育计划、教育目标、教育评价,以及师资、生源、经费、校舍等,并从它们之间的相互联系和相互依存中,找到管理的最佳方式,获得管理的最佳效果”。
在美国,高等教育经费由联邦、州和学区共同分担和管理。作为基层地方政府,学区拥有独立的教育征税权,逐步成为高等教育投资主体。20世纪70年代以来,肯塔基州、印第安纳州、弗吉尼亚州、密歇根州等州政府开展了一系列高等教育财政体制改革,这些改革基本上以“充足基础上的公平发展”为政策取向,推行了专项拨款、公共拨款等活动。学者们也对这些财政改革的公平效果、对学生入学机会的影响等方面进行了实证研究。
最早的研究,如Brown等人(1977)对20世纪70年代美国一系列教育财政改革运动进行了较为客观的总结与评价。研究者通过对20个州时间序列的分析发现,与1970年相比,质量的财政投入明显缩小了8个州州内的教育差距,但仍有6个州在改革后使原有差距拉大。改革所取得的成效与最初的预期还有很大距离。此后,Brown、Ginsburg、Killalea、Rosthal和Tron(1978)以美国50个州的样本进行分析。研究结果显示,在1970—1975年进行的密集的高等教育财政改革后,50个州的教育经费分配的不均等却增加了。虽然这些教育改革政策结果不令人满意,但是它们把基于数据的高等教育质量检测作为促进教育质量发展的现实途径之一,反映出高等教育质量发展政策与实践发展的一种趋势。
1990年,肯塔基州教育卓越支持计划(Support Education Excellence in Kentucky,SEEK)开始实施。这一计划的目的是有效鉴别和改善薄弱学校,要求各州政府和学区要以统考成绩为基本条件,以入学率、退学率和年度改进目标为主要内容来辅助薄弱学校改进。每个州都基本由四个步骤组成,即需要评估、制订计划、实施计划、评价和反馈,并对各阶段制定了具体的标准和要求。
随后,很多学者对其改革的效果进行了评估和研究。Adams和White II(1997)也对肯塔基州1990年改革前后的教育公平性进行了比较,研究以学生生均收入为分析对象,使用极差、极差率、变异系数、基尼系数、麦克伦指数、简单相关系数、弹性系数等指标进行分析,发现改革后学生教育支出的差距缩小了。在研究方法上,使用变异系数考察所有样本地区的生均教育经费收入配置情况。作者认为,州政府对不同财富程度的学区提供教育扶持,能够比较有效地缩小学区间教育经费的差距。
Clark(2003)提出州、学区、学校和公众要共同参与,明晰各方权利和义务。州通过制定符合区域情况的评估工具,帮助学区和学校来予以改进。学区可使用该工具,进行学校和班级成绩数据分析,并采取相应的奖励或惩罚政策来激励学校自我完善,如继续扶持或关闭学校等措施。学校在学区和扶持小组的监督下,要定期向学区和州政府汇报改进情况。
美国印第安纳州1993年开展了一项名为Reward-for-effort高等教育拨款公式改革。Theobald和Taylor(2001)认为到1999年为止,这一改革对横向公平的改善作用很小,但提升了纵向公平的效果。Hirth和Eiler(2005)使用2001年数据对该改革进一步进行公平效果评价,尤其是对办学条件改善的考察,在横向公平测量中运用了全距、限制性全距、联合全距比、方差系数、Gini系数、McLoone指数等多种指标,纵向公平测量中使用了线性回归分析。各指标结果均显示横向公平与纵向公平水平都比较高,说明办学条件是教育资源配置的重要方面,影响了高等教育质量的结果。Toutkoushian和Michael(2008)以2004年印第安纳州高等教育中的师资项目为研究对象,分析其在学区间的分配水平的影响,研究发现这对高等教育质量有极大影响。
Roy(2003)对影响小学6年级学生学业成绩的相关因素展开调查,他使用方差系数、限制性全距比、Gini系数、Theil系数、回归分析研究了资源公平性对不同区域学生成绩的影响,研究发现降低学校间教育经费支出的差距起到了很大的作用。Izraeli和Murphy(2007)也对公立学校教育的公平效果进行了实证分析,他们的数据为1990—2003年的相关数据,使用平均值比较和标准差的方法考察了全部教育经费、州政府拨款占总拨款比例、生均支出在学区间差异、教师平均工资等方面的差异,该研究还考虑了时间和物价的因素,结论一致。Fastrup(2002)使用1992—1996年罗得岛州学区数据,使用OLS估计对该州校级间教育资源投入差距效果进行了评价,教育资源在不同学校间的不公平程度很高,高等教育质量改革所取得的效果很小。
20世纪70年代,美国对于高等教育质量越重视,如何定义、测量、评估学校提供的公共教育和学生在高等教育结束后获得的学习水平等内涵受到的关注就越多,教育质量监测成为重点。近年来,NEAP已成为美国国内持续时间最长的高等教育学生学业成绩评估项目。它也被称为国家教育报告卡(The Nation’s Report Card),依据评价对象分为全国评价、州评价和学区评价,依据用途分为普通评价和特殊评价。通过对NEAP测量结果的分析,学者们可分辨出影响学生学业成绩的关键因素,如学生个人素质、家庭背景因素或群体差异等,探讨不同教育体系之间、不同学区之间和不同学校之间的成绩差距。
NAEP的评价类型按层级分为全国评价、州评价和区域评价;按时间分为长期趋势评价和短期评价;按特性分为普通评价和特殊评价。不同评价在目的、方法、题目和对象上有所不同。无论何种评价,都是通过抽测性考试,采取随机抽样方法的。全国评价和州评价至少每隔两年对四年级和八年级学生的阅读、数学进行测试。长期趋势评价继续对9、13、17岁学生的阅读和数学进行测试。
NEAP的成绩结果也以两种方式向公众报告,一种报告是等级分数(Scale Scores),其中阅读、数学、历史、地理为0~500分,科学、写作为0~300分;另一种报告是将成绩水平分为基本(Basic)、熟练(Proficiency)和高级(Advanced)三个类别。同时,为了保证所有群体的学生适度的进步速度,测验的结果还要按照学生的家庭经济收入状况、种族、残疾状况与英语能力水平(即移民问题)等分类指标,分别进行报告。
NEAP运用多层线性模型分析不同层面因素对学生成绩的影响。NEAP在整个教育系统层面、学校层面、学生个体层面分别分析经济社会文化指数对学生学科成绩的影响。NEAP 2006的研究发现,校际间差距指数缩小一个单位,学生的分数变化为21分。这表明,就NEAP地区平均而言,校际间差距对学生学科成绩的校间影响大于校内影响。
NEAP的公平趋向的测评结果,不仅能表明由于社会经济地位等身份的不平等导致了学校教育的不质量,更重要的是其政策价值——警示和提醒政府必须要采取有效的政策措施来弥合这种校间差异,实现教育的质量发展。
除此之外,小布什政府在2002年提出《不让一个孩子掉队法案》,这一政策延续至今,对美国教育产生了巨大的影响,其明显的一个表现是,各州开始实行绩效评价,加强宏观层面的教育质量监测。2008年3月,美国为加强对落后学校的实质性监督,由国家教育部制定了《差异化绩效责任试点计划》,加大对落后学校和学区奖赏政策力度,建立多元参与的预警制度,从而促进学区之间、学校之间在更高水平上的质量发展。
相比来看,欧盟的学校教育质量指标则更为详细。欧盟从四个领域制定了16项指标:(1)教育成就领域,包含7项指标,即数学、阅读、科学、学会学习、公民的发展、外语的学习及信息技术ICT;(2)毕业率领域,包含有关政策制定的三项指标,分别是中小学校辍学率、高中教育完成率、高等教育就学率;(3)学校教育的监督领域,有学校教育的评价和导向、家长的参与两项指标;(4)资源结构领域,有教师的教育和培训、学前教育的入学率、使用每台电脑的学生数、生均教育经费四项指标。
欧盟委员会认为,这16项指标反映了教育质量的整体信息,能够对欧盟各国的教育质量做出基本的评价。欧盟学校教育质量指标所采用的数据基本上是已经存在的、比较成熟,被公认为是有效的,如IEA的TIMSS\SITES、OECD的PISA、欧洲统计局的各项调查等。同时,可以根据需要,开展专项调查或获取所需数据。这些研究为检测教育事业的质量状况、确认教育不公的原因、指出未来发展方向等提供了宝贵的经验,为人们科学,准确地评价教育公平的现状及发展,进行有效的教育改革做出了保障。
总体来说,对于高等教育质量发展和监测的研究,国外主要使用时间序列数据考察改革前后的差异,分析框架上主要使用了Berne和Stiefel(1984)提出的教育公平分析框架,研究方法上主要使用极差、方差、变异系数、Gini系数、泰尔系数、McLoone指数等指标和OLS估计等进行研究。这些研究从研究框架、指标的选择和研究方法上给国内的研究提供了思路和启发。
新时期最早进行高等教育质量发展问题研究的论文是1994年苌景州在《贵州社会科学》发表的“建立有利于高等教育质量发展的资金保障体系”一文,此后,关注教育质量发展问题的学者不计其数,研究成果也层出不穷。进入21世纪,高等教育质量发展问题从学者的自发研究逐渐走向国家引导性的自觉研究。近年来,全国教育科学规划中最早以高等教育质量发展为核心研究对象的立项课题有多项,如“中国经济发展二元性背景下高等教育资源质量化研究”等。追踪十几年的研究历程,关于高等教育质量发展及其监测机制问题取得的主要研究成果如下介绍。
学者们认为教育质量是系统内部要素之间、阶段之间和单元之间的质量发展,是一种多层次、高水平的质量发展。如于建福(2002)从教育结果的角度,提出高等教育质量是政府提供给公民相对均等的资源和政策条件,从而保障公民教育效果和成功机会的相对质量。翟博(2007)从资源配置的角度,提出教育质量发展既包含着中观层次的区域之间、城乡之间、学校之间、群体之间的教育资源配置的因素,还包含着微观层次的学校内部的教育教学和管理等因素。综合来看,教育质量发展不是静态地均等发展,而是一个“质量——不质量——质量”不断螺旋式上升的动态过程。从阶段来分,它可以分为入学机会(入学率)的大致平等、基本办学条件的大致均等、教师及管理资源的大致均等、学习者学业成就及升学机会的大致均等。从层次来分,最低层次是县域内的大致均等,中等层次的是区域之间大致均等,最高层次是不分民族、地区、性别、家庭背景的学生享有大致均等的高等教育入学机会以及保障顺利完成学业的办学资源及取得大致均等的教育质量与升学机会。
刘颂(2006)从政治经济学的角度分析认为,城市利益集团与农村利益集团对教育政策影响力量不平衡造成发展的不平衡。朱家存(2003)认为高等教育发展失衡的根源在于区域之间不平衡的经济发展实力。鲍传友(2005)认为是我国缺乏制度保障,如教育财税制度、公共保障制度、师资培养制度等匮乏,限制了区域间教育的不质量发展。另外,余秀兰(2004)认为我国教育的城乡差实际上是一种文化再生产的结果。彭世华(2008)则将影响高等教育质量发展的主要因素归结为经济、自然、社会和教育等多个方面。在高等教育资源配置差异方面,袁连生和王善迈(2002)的研究发现,中国省区之间高等教育生均预算内公用经费基尼系数已超过0.5,属于严重不平等。
在促进高等教育质量发展策略方面,黄平(2006)从资源配置的角度提出“政府应作为资源配置的主体对全国范围内的教育资源进行统筹规划、合理配置”。彭世华(2006)认为教育质量已具备实现的可能性,并提出了从学校布局、教育经费投入,到设施、设备、装备和师资配备等方面的高等教育学校质量发展措施。中央教育科学研究所教育政策分析中心(2007)的研究提出,高质量的公平增长,要以教育资源配置为核心,并发放国家和地区适用的教育卡。
关于高等教育的监测与评价研究,多集中在从督导角度进行的办学质量检测研究,而高等教育质量发展的监测与评价研究还很匮乏。早在2003年,袁振国就呼吁“建立教育发展质量系数,切实推进教育质量发展”。至今,颇有影响的研究是翟博(2006)提出的包含教育机会、教育资源配置、教育质量、教育成就四个领域,25个一级指标,43个二级指标的高等教育质量发展指数体系,以及以此对我国1995—2004年间高等教育的质量状态进行的测评。但由于他把这些各种类型的指标综合在一起形成一个质量发展指标体系,测量结果的推广性不足。
针对高等教育质量发展,王景英、张春宏(2009)将高等教育评价的内容大致分为三个部分:基础性内容、发展性内容和灵活性内容。基础性内容分为省域教育发展战略规划、教育经费投入与管理、办学条件、教师队伍、环境与安全 5个二级指标;发展性内容分为教育信息化、教育科研水平、社区教育的发展情况、社区教育的发展情况4部分;灵活性内容和标准分为办学体制和培养模式改革情况、地方课程和校本课程的开发情况、学校布局调整的合理性 3个二级指标。楼世洲、宁业勤(2009)从起点公平、过程公平和结果公平三个领域设计了入学机会、政策规划、经费保障、条件设施、师资配置、普及效果、学业成功等7个一级指标和21个二级指标。陈世伟、徐自强(2010)采取了专家调查法的指标设计策略,从高等教育质量发展的总体目标、资源配置、预期结果和教育管理等方面确定了衡量与规范高等教育质量发展的一级指标和二级指标。具体包括教育机会的质量程度、教育资源配置的质量程度、教育结果的质量程度、教育经费的质量程度、教育管理的质量程度等5个一级指标,并根据专家调查法给出了一级指标和二级指标的相应权重。崔慧广(2010)选择学校作为高等教育财政质量的测度分析单位,并以高等教育财政横向质量和纵向质量为出发点,从师资水平和办学条件出发设计了生师比、专任教师学历合格率、办学条件危房率、生均图书数、生均教室面积、教学仪器配备率、音体美教学器材配备率等7个测量指标。
从上述文献看,代表性的监测方案有两种,这两种方案的指标研究与设计的质量亟待提高。第一种是从教育质量内容来设计,如教育机会质量、教育资源配置质量、教育质量等维度构建。第二种是从城乡之间、区域之间和校际之间来构建。两种方案虽都指出质量要达到的指标层次、类型、临界点及具体权重,但由于对教育质量发展理论和监测理论研究的理论基础不足,所构建的质量发展指标体系未能针对我国高等教育发展的实际状况,难免会有失偏颇,这也是本研究注意的地方。
与国外学者相比,国内学者对高等教育质量发展指标及监测机制进行了深入的理论研究,但研究结果的实效性有待加强。无论是指标体系构建,还是实际操作的步骤和程序,以及结果呈现方面,国外高等教育质量发展监测都是一个有机联系的整体。在当前,如何科学、规范、持续、广泛、制度化地评价、判定、监测、调控高等教育质量发展的状态和进程,构建具有科学性、规范性与可操作性并存的高等教育监测技术系统,也成为本书的创新之处。