我们对高考制度改革的具体分析从非平行志愿到平行志愿的改革说起。从非平行志愿(有时被称为顺序志愿)到平行志愿的改革是高考制度改革的一个重要方面。在匹配理论上,这一改革可以看成是从所谓的立即录取(Imme-diate Acceptance,简称IA)或波士顿机制(IA-BOS机制)到DA-GS机制的转变。我们接下来会介绍IA-BOS机制的运作方法和匹配性质。相对于DA-GS机制而言,IA-BOS不是稳定的机制,在该机制下,学生也不会选择如实报告偏好。因此,从理论上讲,平行志愿的引入可以使大学录取的结果更稳定(或者说更公平),并减少了学生在志愿填报中的策略性行为(或者说增加如实填报的可能性)。
不过,针对中国高考制度的特点,只是简单地引用理论并不会给出完美的答案。我们即将看到,中国高考制度的某些特点作为理论的特例出现,因此可能出现比经典理论更强的一些结论。与此同时,又有一些特点违背了经典理论的某些假设,从而使我们的讨论复杂化。而上述两种特征(即简单化和复杂化的特征)同时出现,又会对我们的讨论产生更加复杂的影响,使我们必须更加仔细地修正原有模型的结论。
我们不妨先从一个极其重要的特征开始,中国的大学录取是所有大学按照统一标准即高考总分录取的。虽然不同省份的考卷不同,而且在相当一段时间内的文理分科制度下,文科和理科的考试科目和试卷内容也不同,但这不影响我们对这一特征的界定。这是因为不同省份和文理科的考生并不需要跨省份或跨文理比较。中国的大学录取预先分配了各个省份和文理分科的名额。由此,我们可以把不同省份和文理科考生分别视作不同的“匹配系统”。因此,中国31个省、市、自治区的文理分科合在一起可以被看成31×2=62个(甚至更多)匹配系统。每个系统包括了所有大学(针对这个省份和文理科生分配的名额)和某一个省份的全部文理科生。
这就意味着,在同一个匹配系统内,大学对所有学生的偏好或者优先序是完全相同的,即具有一种同质的偏好。此外,如果遇有总分相同的学生,我们可以再按照某种统一标准排序(即“打破平分”),比如在总分相等前提下按既定科目进行字典排序。因此,大学对学生的偏好不仅是同质的而且是严格的。在文献中,这属于非循环(Acyclic)偏好的情况(可参考Ergin,2002;Haeringer and Klijn,2009)。所谓非循环,就是不同学校的偏好如果串接起来,不会构成循环,即不存在类似公共选择理论中的投票悖论(又称“孔多塞悖论”)的情况。值得强调的是,文献中定义了各种类型的非循环偏好(后续我们将谈到),但同质偏好是最强的一种非循环偏好,即满足文献中定义的所有非循环偏好特征。集中化的大学录取机制和采取单一维度的录取标准,可以说是中国高考制度非常显著的一个特征。我们下面先来讨论在这一特征下,原有的DA-GS机制会有怎样的特殊结论。
根据前面第1.2节的分析,我们已经知道,如果采取学生提议的DA-GS机制,可以实现对学生最优的稳定匹配结果,而且学生是说实话的。实际上,我们可以有进一步的结论:在上述大学的偏好完全相同的前提下,比如都以高考总分对学生排序,我们可以证明,稳定匹配是唯一的,且是帕累托(事后)
有效率的。我们还发现,这一稳定匹配结果可以通过所谓的序列独裁机制来实现。这同时也意味着序列独裁机制和DA-GS机制在这里是等价的。
序列独裁机制的算法如下。
第一步:由分数最高的学生挑选其最喜欢的学校。
第二步:由分数次高的学生在仍然有空余名额的学校中挑选其最喜欢的。
……
最后一步:由分数最低的学生在仍然有空余名额的学校中挑选其最喜欢的。
不难看到,现实中的平行志愿更接近于序列独裁机制,而不是经典意义下的DA-GS机制。这也是我们把平行志愿称作“分数优先”的原因。不过,由于两种机制的等价性,为我们借助匹配理论进行探讨铺平了道路。既然DA-GS机制(或者说序列独裁机制)实现了学生最优的稳定匹配,同时还是帕累托最优的,那么,是不是将中国的高考志愿填报机制彻底改变为这一理想机制就解决问题了呢?答案并非如此。
这里的问题是,在经典的DA-GS机制或序列独裁机制下,所有学生需要对他(她)可以接受的全部学校(和专业)进行排序。这带来了两个额外的难题。第一,这为录取制度带来了较高的行政负担。虽然高考制度是按分数录取的,但在实际运作中,存在在学校内选取专业等问题,录取过程不太可能在瞬间完成。当一个学生的“档案”进入某个待考察的学校时,可能需要停留一段时间。如果一个学生最终会被志愿表中靠后的学校录取,这个等待时间可能较为漫长。当然,随着信息技术的发展,这个问题也许可以得到很好的解决。
第二,也许更重要的是,每个学生填报他(她)可接受的所有学校(和专业)也是不可实现的任务。对大致2000所大学进行精确排序,考虑到信息获取成本或者认知负担,几乎是不可能的。而实际上,有很多学校是学生几乎不需要考虑的大学。比如,一个高考分数处于所有考生中段的人填报“985”大学几乎毫无意义,要求一个高分考生考虑他(她)对专科学校的排序也是如此。我们可以把一个考生在任何稳定均衡下都无法得到的学校称为他不可企及的范围。所谓不可企及,比字面意义有所扩展,涵盖了学生认为比稳定匹配的大学更好和更差的(可接受的)大学。由于这里的稳定匹配是唯一的,可以说除一所学校之外的学校都是不可企及的。因此,对于偏好序中他(她)明确(或者以很大的概率)不可企及的学校进行了解,并据此对所有大学排出一个完备的顺序,并不是理性的选择。
实际上,不少实验和实证的研究都发现,即使在DA-GS机制下,在世界各国以考试方式进行录取的大学甚至中学中,不少学生都不会按照真实偏好填报,他们通常仅选择填报少量学校,甚至少于填报机制允许填报的学校数量。这样的填报方式并没有对学生造成实质性的伤害。关于这方面的研究可参考我们的工作论文(Li、Wang and Zhong,2023)及其中引用的文献。因此,一个理想的DA-GS机制似乎既不可行,也不必要。在现实中,中国的高考录取机制采取的正是一种只允许学生填报少量学校(一般来说10~20所)的机制。这就已经不是经典意义下的DA-GS机制或序列独裁机制了,我们将在讨论完IA-BOS机制之后,专辟一节来讨论这种填报志愿个数受限制的机制,以及其他一些DA-GS机制的变种。
在实行平行志愿改革之前,中国的高考志愿填报一直采取的是非平行志愿机制,也被称为顺序志愿制度。相对于DA-GS机制这一“分数优先”制度而言,它是一种“志愿优先”制度。这一制度在匹配理论中被称为波士顿机制或者立即录取机制,前一个名称的来历是因为美国波士顿地区的中学采取了这样的录取机制,后一个名称则是根据其性质命名的。
IA-BOS机制的算法如下。
第一步:每个学生向其最偏好的大学发出邀约。
第二步:每个大学接受向其发出邀约的学生中最偏爱(或优先级、分数最高)的学生,拒绝超过其名额限制的那些学生(如果有的话)。
第三步:在上一步中被拒绝的学生向其第二偏好的大学发出邀约。
第四步:每个仍然有剩余名额的大学在其剩余名额中接受向其发出邀约的学生中最偏爱的学生,拒绝超过其剩余名额限制的学生。
……
如果所有学生的邀约都被接受,或者(某些)学生所有的邀约都已经被拒绝,则算法结束。
这里的关键是:当大学在某一个轮次接受了学生的邀约之后,不能再毁约,即不能再拒绝已录取的学生。这也是名称中“立即录取”的来历。而在DA-GS机制下,在录取正式结束前,学校可以随时毁约。
IA-BOS机制不是说实话的机制,如例3.1所示。
例3.1。有三个学生:张三、李四和王五,有三所大学:A、B和C。每个大学只有1个录取名额。学生和大学的偏好如表7所示。
表7 大学录取市场中的偏好
即所有学生都有相同的大学偏好,而所有学校也有相同的学生偏好。可以想见,学生对学校和学校对学生的竞争都是白热化的。
在DA-GS或序列独裁机制下,学生如实报告偏好,得到这个匹配问题的唯一稳定结果(因为大学偏好同质),为:{(张三,A),(李四,B),(王五,C)}。我们下面说明,在IA-BOS机制下,所有学生说实话不构成纳什均衡。假定张三和李四说实话,而王五报告偏好如下:
王五的(假)偏好:B>A>C。
我们根据算法来分析。
第一步:张三、李四都申请学校A,王五申请学校B。张三被学校A录取,李四被学校A拒绝。王五被学校B录取。注意这些录取都是最终结果。
第二步:李四申请学校B。学校B因已录取王五而名额已满,拒绝李四。
第三步:李四申请学校C,被录取。算法结束。
因此,在IA-BOS机制下,匹配结果为:{(张三,A),(李四,C),(王五,B)}。这一结果使得王五比如实报告偏好下得到的学校C更好,因此他有激励偏离真实报告偏好,即所有人真实报告偏好不是纳什均衡。
我们下面来分析该博弈的纳什均衡。首先,张三必须将A学校放在第一志愿,否则必然会有人把A放在第一志愿,从而抢走A。而一旦张三把A放在第一志愿,他必然得到A,后面两个志愿如何填(甚至不填)都无关紧要,我们称他的纳什均衡策略为(A,∗,∗),“∗”表示任意其他学校。其次,对李四来说,如果他的第一志愿也为A,则王五必然会把第一志愿写为B,从而抢走B,留给李四C。因此,李四的第一志愿只能为B。后续志愿也是无所谓的,即李四的纳什均衡策略为(B,∗,∗)。剩下的王五则只要在任何一个志愿中写入C即可,从而得到C。均衡的匹配结果仍然是:{(张三,A),(李四,B),(王五,C)}。
在纳什均衡策略中,只有张三是如实报告偏好的(如果忽略他的第二和第三志愿),其他两位都没有如此行事。从上面的分析中,我们还发现,虽然纳什均衡策略组合不是唯一的(由于存在许多“∗”),而纳什均衡的匹配结果却是唯一的,且是稳定匹配。这一结论是否具有一般性呢?答案是肯定的,在埃尔金和森梅兹(2006)的论文中,他们证明了IA-BOS机制下纳什均衡集合等价于稳定匹配集合。注意到在中国高考制度下,由于大学采取的是“分数优先”的同质性偏好,稳定匹配集合是一个“单点集”,则只有一个稳定匹配和一个纳什均衡结果。
他们还证明了,在极为一般的大学偏好下,给定任何一个稳定匹配(不一定是唯一的),所有学生把他们在该稳定匹配下的大学作为第一志愿必定构成纳什均衡,同时必定被第一志愿录取。为了说明这一结论,我们不妨考虑如下:给定其他学生都选择了在某一个稳定匹配(记为μ)下的学校作为第一志愿,考虑某学生甲以及比其稳定匹配更偏好的某个学校A。则A学校必定在该稳定匹配下录满(A不可能有空位,否则μ不是稳定的),也就是说,被其他学生占满。注意到其他学生都是第一志愿填报了该稳定匹配学校,则A学校必定在第一轮就录满。因此,对学生甲来说,唯一可能的有利偏离必定是把A学校作为第一志愿来争取。但这样一来,A学校必定无法录取他,即这样的偏离必定没有好处。
更进一步,我和吴斌珍(Wu and Zhong,2020)的一项研究表明,当稳定匹配是唯一的,且大学的名额具有“过度需求”时,在IA-BOS机制的纳什均衡下,学生必定会把稳定匹配下的具有过度需求的学校作为第一志愿填报。这里,只要满足:(1)稳定匹配属于这个大学集合的学生总数等于这个集合中大学总的录取名额数;(2)有至少一个学生,其稳定匹配学校不属于该集合,但他偏爱这个大学集合中的任何一所学校胜过其稳定匹配的学校,则该大学集合中任何一所大学我们都可以称之为录取名额“稀缺”的大学,也即具有过度需求的大学。这一性质对中国的某些大学来说是容易满足的,比如“985”大学以及“211”大学的集合。
这些结论说明,在IA-BOS机制下,在志愿填报时提供给学生多个学校的选项实际上并没有太大意义。学生只需要“找准”自己的稳定匹配学校,将其放到第一志愿就万事大吉了。这和DA-GS机制恰好形成了有趣的对比,DA-GS机制推崇的是说实话,即学生报告一个对所有学校的完整偏好。不过,IA-BOS机制的信息负担也同样是不可克服的:要找准自己的稳定匹配学校,需要完备信息,即知道同一匹配系统中(也就是同一省份相同文理科)所有考生对所有大学的偏好、他们的考分和所有大学的名额。这何其之难!也就是说,就现实问题而言,采取完全的DA-GS机制和完全的IA-BOS机制几乎是不现实的。前者要求的完全偏好显示和后者要求的“一发破的”都需要很高的信息成本和认知能力。为此,我们不得不考虑一种既不要求(或者说没有必要)填报所有学校同时又不仅限于填报一所学校的机制。我们接下来就考虑这样一种有限制的大学录取机制。
讨论对志愿填报机制的一种普遍存在的限制,即对于学生填报的学校个数的限制,是非常有现实意义的。在中国的大学录取机制中,对于学生填报的大学个数(更不要说专业个数)都存在这样的限制。中国的大学有2000多所,但学生志愿填报表中允许填报的学校通常只有20多所。那么,对学生填报志愿个数的限制是否会影响填报志愿的行为?是否对匹配结果产生影响?
海宁格和克里金(Haeringer and Klijn,2009)的论文系统地研究了这一问题,他们把这一类问题称为有限制的择校问题。显然,这一限制的引入使得学生无法按照真实偏好填报。相反,在有限的学校填报个数这一“稀缺资源”下,他们必须合理使用有限的填报“空间”,一方面冲刺尽可能好的学校(甚至超过自己能力所及),另一方面又需要使自己不至于落榜,即建立一定的保险机制。显然,这种限制对不同的机制可能有不同的影响。文章讨论了有限制的填报对IA-BOS、DA-GS(文章称为对学生最优的稳定机制,简称SOSM)和另一种机制即顶端交易循环(Top Trading Cycles,简称TTC)的影响。下面我们集中讨论前两种机制受到的影响。
3.3.1 有限制的IA-BOS机制
我们可以预见在IA-BOS机制下,填报志愿个数的限制影响是很小的。为什么呢?首先,IA-BOS本身就不是说实话的机制,学生本身需要进行策略性思考,只不过现在需要在有限的志愿个数下填报。其次,我们在上一节(3.2节)的分析中已经看到,学生将(任何一个)稳定匹配下的学校作为第一志愿本身都构成了纳什均衡,并实现了稳定匹配。此时,学生从第二志愿开始的填报实际上无参考意义。这就提示我们,即使只允许填报一个学校的IA-BOS机制,也完全没有妨碍到在纳什均衡下实现任何一个可能的稳定匹配。
实际上,在海宁格和克里金(2009)的文章中,他们说明,在IA-BOS机制下,均衡结果根本不受填报志愿个数的限制,即在任何填报志愿个数的限制下,均衡结果的集合都相同。同时,所有的均衡结果都对应着某一个稳定匹配,但均衡策略会受到影响。可能的是,在填报志愿个数限制越宽松(即填报个数越多)的情况下,均衡策略更多(即存在更多的多重均衡),而这实际上有可能增加了填报的难度。当然,这一讨论的前提是信息是完全的,在任何志愿个数的限制下,所有学生都能推导出相应“博弈”下的全部均衡策略组合,“苦恼”的只是不知道应该选择哪个均衡,即存在所谓的“协调”问题。不过,当学生面对信息不对称时,填报志愿个数增加是不是也有一定好处呢?比如提供了某种保险机制。这个问题文章没有回答,目前文献也几乎没有涉及,有待后续的研究予以回答。
3.3.2 有限制的DA-GS机制
有限制的DA-GS机制分析起来比较复杂。在不受限制的DA-GS机制下,我们知道学生说实话是弱占优策略,但我们尚未讨论是否还有其他的均衡策略。在有限制的DA-GS机制下,“说实话”策略自动消失了,我们不得不挖掘其他均衡策略。海宁格和克里金(2009)首先证明了一个均衡策略的性质,即均衡策略随着填报个数限制的放宽而逐级嵌套:在允许填报个数较小情况下的均衡策略,随着志愿填报个数限制的放宽,仍然是均衡策略。类似于IA-BOS机制,在DA-GS机制下,无论填报个数限制是多少(包括完全没有限制),都存在一个“第一志愿”均衡,即每个学生填写的第一个志愿就是最终的录取结果。注意,在限制填报志愿个数为1这种最极端的情况下,IA-BOS和DA-GS机制完全等价。根据上述关于IA-BOS机制的论述,第一志愿(纳什)均衡结果集合与稳定匹配集合是完全重合的。这也就意味着,限制填报志愿个数为1的DA-GS机制下的纳什均衡结果也必然和稳定匹配结果重合。
那么,当志愿填报数大于1时,有限制的DA-GS机制下的所有均衡结果是否都稳定呢?并非如此。海宁格和克里金(2009)的研究表明,当且仅当学校的偏好序满足埃尔金非循环性质(来自Ergin,2002)时,DA-GS机制在均衡结果时才能确定地实现稳定匹配。这里,埃尔金非循环性质是一种特殊的非循环性质,它保证了“没有学生可以在不改变其匹配结果的前提下,阻止任何其他两个学生潜在的改进”。在这一非循环性质不满足时,他们的文章举例说明了,无论是有限制(填报数大于1)还是无限制的DA-GS机制,都可能存在不稳定的纳什均衡结果。
从上述论述中可以得到一个重要推论:在埃尔金非循环性质满足的前提下,DA-GS机制的均衡结果也和填报个数限制无关。这是因为当限制填报个数为1时,所有的稳定匹配都可以被(“第一志愿”)纳什均衡实现。而我们知道不同填报个数限制下的均衡又是嵌套的,且所有均衡又都是稳定匹配的。因此,无论填报多少个学校,均衡的结果都是相同的——都是所有稳定匹配的集合。
由于中国高考制度下的大学偏好的同质性(“分数优先”)是最强的非循环性质,因此也必然满足埃尔金非循环性质。也就是说,在中国的高考制度下,无论是有限制的IA-BOS机制或DA-GS机制,纳什均衡结果都和有无限制、限制多少无关,且均衡结果都是(唯一的)稳定匹配。
以上我们从两个角度接近了平行志愿的真相:第一,它类似于一种DA-GS机制,而过去的非平行志愿类似于IA-BOS机制;第二,它并非一种完美的DA-GS机制,而是一种受限制的机制。不过,中国高考制度中的“中国特色”还有一点我们没有挖掘,即它是一种分批次录取的机制。在中国的大学录取中,国家将大学分为若干批次(如“一本”“二本”“专科”等)。学生的志愿填报也相应归入不同批次,在规定的批次中,学生只能在规定的大学内选择有限个大学(例如3~5个)进行填报。当上一个批次的录取结束后,下一个批次的录取方可开始。与这种分批次录取机制相对应,平行志愿机制也是按批次的“平行”,即在同一批次内,根据学生填报的该批次内的大学志愿,按照分数优先的原则进行录取。只有当某一批次录取结束之后,学生才能进入下一批次的录取,在这一批次中再按平行志愿进行考察,以此类推。
3.4.1 有限期的申请-拒绝机制
陈岩和凯斯滕(Chen and Kesten,2017)提出一种有限期的申请-拒绝机制,并认为该机制最好地刻画了中国实行的平行志愿机制。他们提出的机制实际上是一“族”机制,其中每个机制对应一个特定的参数e,e表示录取结束的期限,他们把它称为具有执行期e的申请-拒绝机制(Application-rejection Algorithm with Permanency-execution Period e)。我们这里简称为有限期的申请-拒绝机制。
该机制运行如下。
第一轮录取开始。
第1.1步:每个学生申请第一志愿的学校。每个学校暂时录取优先级最高的学生,直到用完录取名额。
第1.2步:在上一步被拒绝的学生,(i)若上一步未到达其第e志愿,继续申请其下一个志愿;(ii)若上一步已到达其第e志愿,不能再申请。每个学校暂时录取所有申请中优先级最高的学生,直到用完录取名额。
……
第一轮结束在所有学生的第e志愿都已被考虑。此时的预录取全部确定为永久性录取。被录取的学生和已经使用的录取名额退出后续的录取过程(使用完所有名额的学校则完全退出录取)。
第二轮录取开始。
第2.1步:每个(剩下的)学生申请第e+1志愿的学校。每个仍有录取名额的学校暂时录取优先级最高的学生,直到用完录取名额。
第2.2步:在上一步被拒绝的学生,(i)若上一步未到达其第2e志愿,继续申请其下一个志愿。(ii)若上一步已到达其第2e志愿,不能再申请。每个学校暂时录取所有申请中优先级最高的学生,直到用完录取名额。
第二轮结束在所有学生的第2e志愿都已被考虑。此时的预录取全部确定为永久性录取。被录取的学生和已经使用的录取名额退出后续的录取过程(使用完所有名额的学校则完全退出录取)。
第三轮录取开始。
……
如果发生以下两种情况之一,则整个录取过程结束。
情况一:每个学生都永久性或暂时性得到一个学校,对其中暂时性得到学校的学生将其暂时性得到的学校确认为永久录取他的学校。
情况二:所有学生的所有志愿均已考察完毕。
不难看出,这一录取机制在e=1时,即为IA-BOS机制。此时,上述机制在每一轮均只有1步,每一步录取都是永久性的。而在e=∞时,即为DA-GS机制,此时只有一轮录取。作者认为,e∈[2,∞]下即刻画了某种平行志愿机制。
我们来讨论这一机制的性质。首先,不难发现,有限期的申请-拒绝机制并非稳定机制。这里的稳定,是指在所有学生都真实填报志愿的前提下,录取结果是稳定匹配。显然,由于录取被强制限定在每个学生考虑每e个志愿后就进行一次录取的“永久化”,阻止了学校选择延迟录取,也“加速”了学生被录取的进程,因而并不是稳定的。陈岩和凯斯滕(2017)证明了,随着e(即暂时接受的期限)的延长,如果新的期限e'是原来期限的倍数,即e'=ke,k为大于1的整数,则更长期限下的机制稳定性更高,这里,A机制比B机制稳定性更高定义为“在所有问题(即参数)下,如果B机制是稳定的(即如果所有学生都说实话带来稳定匹配),则A机制也一定是稳定的。反之则未必成立”。按照这一原理,DA-GS机制是所有机制中最稳定的,而IA-BOS机制则是所有机制中最不稳定的。注意这一结论并没有保证对于任意的e'>e,e'下的有限期申请-拒绝机制比e下的更稳定。
上述结论只说明了在所有学生都说实话的前提下,DA-GS是最稳定的机制,IA-BOS最不稳定。但是,在该族机制中,除了DA-GS机制,其他机制都不是学生说实话的机制。因此只是比较在学生说实话前提下的机制性质可能没有太大意义。我们通过下面的例3.2来进一步说明。
例3.2(来自Chen and Kesten,2017)。有四个学生:张三、李四、王五和刘六,有四所大学:A、B、C和D。每个大学只有一个录取名额。学生和大学的偏好如表8所示:
表8 大学录取市场中的偏好(之一)
在所有学生都说实话的DA-GS机制(即e=∞)下,匹配结果为:{(张三,大学C),(李四,大学B),(王五,大学A),(刘六,大学D)}。可以证明,这是唯一的稳定匹配。
考虑IA-BOS机制(即e=1)。根据埃尔金和森梅兹(2006)的研究,所有纳什均衡都是稳定匹配,且任何一个稳定匹配都可以为一个纳什均衡所实现。不难发现,至少存在如下纳什均衡(但不一定唯一)。
张三:(C,∗,∗)
李四:(B,∗,∗)
王五:(A,∗,∗)
刘六:(D,∗,∗)
显然,此时的机制不是说实话的,但匹配结果是稳定匹配。那么,在任意的e下,有限期的申请-拒绝机制会导致所有的纳什均衡结果都是稳定的吗?陈岩和凯斯滕(2017)的结论是不一定。他们证明,只有在e=1(即IA-BOS机制)下,纳什均衡才必定是稳定匹配。
为此,考虑如下学生策略。
李四:B>D>A>C。其余三人仍然真实填报。
按此策略组合得到的匹配结果为:{(张三,A),(李四,B),(王五,C),(刘六,D)}。该结果不是稳定的,但帕累托优于唯一的稳定匹配。 令人惊讶的是,只要e≥2,即有限期申请-拒绝机制不是IA-BOS,这一策略组合都构成纳什均衡,甚至包括DA-GS(e=∞)。只是在e=∞下,学生没有出弱占优策略而已。
为证明该策略组合为纳什均衡,只需要注意在上述策略组合下,唯有李四有激励改变策略。假定他将第一志愿改为A。虽然在第1.1轮录取结束后可以得到A,但这只是预录取。容易发现,他在第1.3轮会被王五从学校A挤走(此时王五为第2≤e志愿),则最好的结果仍然为B。如果他将第一志愿改为C或者D。他在第1.1轮录取结束后得到C或者D,且永远不会被赶走(因为优先级最高)。而如果他的第一志愿为B,所有学生都在第1.1轮得到录取,他得到B。由此,上述策略组合为纳什均衡。
上面我们说明了,除了DA-GS(e=∞),其他机制都可能不是说实话的机制。那么,是否可以在这些机制之间做出某种比较,表明一些机制比其他机制更不容易说实话,或者说更容易被操纵。陈岩和凯斯滕(2017)定义了,某一个机制A比另外一个机制B更容易被操纵,满足“对于任何问题(即参数),B是可以被操纵的,那么A一定也是可以被操纵的。反之未必成立”。那么,一个机制可以被操纵是什么意思呢?按照他们的定义,这意味着,如果其他人都说实话,至少存在一个学生选择不说实话是更好的,即存在偏离。换句话说,说实话不是纳什均衡。
我们已经发现,DA-GS是说实话的机制,即存在说实话的纳什均衡,或者也可以说,DA-GS机制(e=∞)是抗操纵的(Strategy-proof)。我们也发现,IA-BOS机制(e=1)不是抗操纵的。按照这一观察,应该是e越大的机制,越有可能存在说实话的纳什均衡,即越抗操纵。的确如此,陈岩和凯斯滕(2017)表明,随着e的增加,存在说实话均衡的可能性确实在增加,即更大的e对应的有限期申请-拒绝机制更抗操纵。
不过,我们也注意到,在IA-BOS机制下,不说实话的纳什均衡,即每个学生都把某一个稳定匹配下的学校作为第一志愿,在其他机制下也是纳什均衡。但反过来,在e≥2下不说实话的纳什均衡,如我们给出的那样,却不是IA-BOS下的纳什均衡。这就暗示我们,随着e的增加,不说实话的纳什均衡的数量可能在增加。这个观察也被证明是正确的。陈岩和凯斯滕(2017)也证明了,在更小的e机制下的纳什均衡,在更大的e机制下也必定是纳什均衡。因为说实话的均衡始终只有一个,因此当e增加时,增加的纳什均衡几乎都是不说实话的纳什均衡(除非增加的就是说实话均衡,而这只在e=∞下才总是正确的),这在我们例子中已经显现出来了。
这一结论与上面认为e越大越抗操纵的结论看似有些矛盾。关键在于如何定义抗操纵。如果我们只关注说实话是否为纳什均衡的话,那么e越大的机制越抗操纵。但如果我们关注“多重均衡”的个数,特别是不说实话的多重均衡的个数,则e越大这样的均衡可能越多,至少不减少,即e越大有可能越不是抗操纵的。
更有意思的是,在IA-BOS机制下,即使只存在不说实话的均衡,他们也都实现了稳定的匹配。但当e≥2时,纳什均衡反而有可能带来不稳定的结果。因此,从这个意义上讲,e越大的机制可能越不稳定。这和我们上面阐述的e越大且更大的e是更小的e的倍数时,更大的e意味着更稳定的机制又有所矛盾。这里的问题同样是来自定义上的差别。如果我们只看是否在说实话的情况下(无论说实话是否为均衡)达到稳定匹配的可能性,则e越大有可能是越好的,直观地说,更小的e,即更快地使得录取“永久化”阻碍了寻找新的匹配机会,从而阻止了稳定匹配的实现。但如果考虑学生存在不说实话的可能性,则更大的e使这种可能性增加了,从而带来了更不稳定的结果。这些看似矛盾的结果也提醒我们,需要准确理解文章的前提和定义,否则在实际运用中可能带来困惑或者错误的政策。
有限期的申请-拒绝机制与有约束的择校机制 。在这一节,我们关注以上研究过的两种机制的关系。一种是有约束的DA-GS机制,在这一机制下,每个学生只允许填报有限个学校,不妨定义这个个数为e。当这些学校被考虑后,匹配自动中止,已有的录取永久化。有意思的是,有限期的申请-拒绝机制,在其第一阶段,和有约束的DA-GS机制是完全一致的,即只考虑学生提交的前e个志愿,并在考虑完学生的所有这些志愿后,永久化已有的录取,没有被录取的学生允许进入第二个阶段继续填报和录取。这两种机制是否存在某种等价关系呢?我们证明了如下结论:在有约束的DA-GS机制下的纳什均衡策略,必定是在有限期的申请-拒绝机制下的纳什均衡策略。具体来说,我们对有约束的DA-GS机制下的纳什均衡策略进行扩充,在学生填报的e个学校志愿之后加上任意的可接受的所有学校排序,使之成为完整的学校偏好。这一策略(不妨称为扩充的有约束的DA-GS机制的均衡策略)必定在有限期的申请-拒绝机制下也是纳什均衡策略,证明如下。
我们只需要证明,在有限期的申请-拒绝机制下,对于某个学生甲,在其他学生都提交上述扩充的有约束的DA-GS机制的策略下,他提交扩充的有约束的DA-GS机制下的策略(以下简称“扩充均衡策略”)是最优的。
给定其他人的扩充均衡策略。如果学生甲在有限期的申请-拒绝机制的第一阶段(即第1到第e志愿)已经被录取了。设录取他的是学校A。我们证明无论他如何修改策略(即志愿填报顺序),都不能得到更好的学校。首先,对于排列在第1到第e志愿的学校,显然任何修改都不能使之更好,因为这是有约束的DA-GS机制下的最优策略。其次,考虑其扩充志愿表中第e+1到最后的(可接受的)学校。如果存在一个志愿表,使他能得到好于A的学校B,则学校B满足:(1)学生甲可接受;(2)学校B在第一阶段结束时,要么名额未录满,要么名额已满,但录取的学生优先级低于学生甲,否则后续无法录取学生甲,则学生甲将学校B作为第e志愿一定会被录取。这说明原来的策略不是有约束的DA-GS机制下的均衡策略。推出矛盾。
现在假定在第一阶段结束时,学生甲未被录取。由于这一策略在有约束的DA-GS机制下是最优策略,则任何策略调整都不能使学生甲在第一阶段结束时得到更好的学校。考虑它在后续阶段可能得到的学校,我们可以证明,对于这一步结束后所有可接受的学校,要么已经用完名额且录取了优先级高于他的学生,要么将学生甲视作不可接受的。若非如此,学生甲可以将一所他可以接受、没有录满人数或用完名额但录取了优先级低于他的学生且愿意接收他的学校作为第e志愿并被录取,比未被录取更好。这与调整前策略为有约束的DA-GS机制下的均衡(最优)策略矛盾。
3.4.2 中国的平行志愿机制
上述有限期的申请-拒绝机制是否最完美地逼近了中国高考制度下的平行志愿机制呢?表面上看,这一机制和我们谈论的平行志愿机制的运行仍然存在差别。这是因为,中国的平行志愿机制是一种序列独裁机制。它把学生根据分数由高到低进行排序,逐一进行录取,每个学生考虑完毕即录取,不存在预录取。而上述有限期的申请-拒绝机制则根本不要求学校对学生有相同的优先序,并且在一定期限内仅为预录取。不过,它们有一点相似,即都是分批次录取:将学生的每e个志愿看成一个批次,每一批次录取结束后,即永久化录取结果。
为此,我们先引入分批次的序列独裁机制,将它作为对分批次的平行志愿机制的完美刻画。我们引入与它们类似的参数e,该参数刻画了在每一轮(即批次),学生允许填报的学校个数。我们不妨直接称之为中国的平行志愿机制。
该机制刻画如下,假定学生总人数为N。
第一轮(批)录取开始。
第一步:分数最高的学生的第1到第e志愿被依次考虑。他将被有剩余名额的学校中处于其最高志愿的学校录取。
第二步:分数次高的学生的第1到第e志愿被依次考虑。他将被有剩余名额的学校中处于其最高志愿的学校录取。
……
第N步:分数第N高(即最低)的学生的第1到第e志愿被依次考虑。他将被有剩余名额的学校中处于其最高志愿的学校录取。
第一轮录取结束。被录取的学生和被使用的名额从系统移除(使用完所有名额的学校整体移除)。假定被录取学生人数为N 1 <N(否则录取结束)。
第二轮(批)录取开始。
第一步:在第一轮未被录取的学生中,分数最高的学生的第e+1到第2e志愿被依次考虑。他将被有剩余名额的学校中处于其最高志愿的学校录取。
第二步:在第一轮未被录取的学生中,分数次高的学生的第e+1到第2e志愿被依次考虑。他将被有剩余名额的学校中处于其最高志愿的学校录取。
……
第(N-N 1 )步:在第一轮未被录取的学生中,分数第(N-N 1 )高(即剩余学生中分数最低)的学生的第e+1到第2e志愿被依次考虑。他将被有剩余名额的学校中处于其最高志愿的学校录取。
第二轮录取结束。第三轮录取开始。
……
录取完全结束,当所有学生均被录取,或者所有学生的所有志愿均已被考虑。
可以证明,有限期的申请-拒绝机制和平行志愿机制(或分批次的序列独裁机制)是等价的。也就是说,给定学生填报的完整志愿(包括每一轮的每一个志愿),其录取结果必然是相同的。证明如下:
首先考虑第一轮录取。我们(机制设计者)对学生的偏好做如下加工,去掉学生所填的第e+1个学校直到其最后一个学校,即“假装”这些学校是学生不可接受的。注意,这样的处理完全不影响学生在两种机制下的任意一种的第一轮录取结果。给定这一被加工的偏好,两种机制的录取结果就分别对应于没有任何限制的DA-GS机制和序列独裁机制的录取结果。我们知道,这两种机制实现的都是唯一的稳定匹配结果(因为大学的偏好是同质的,都是“分数优先”),因此其录取结果是相同的。这就证明了第一轮结束时,二者录取结果相同。接下来,我们考虑第二轮录取,仅考虑未被第一轮录取的学生填报的第e+1到第2e个志愿,仍然按照上述方式进行志愿加工。同时注意到第一轮录取后剩下的学生和学校名额在两种机制下都是完全相同的。不难得出,第二轮结束后,二者的录取结果仍然是相同的。以此类推,两种机制在所有轮次结束后的录取结果必然相同。
得到这一等价关系后,我们至少可以认为,中国的平行志愿机制不能违背有限期的申请-拒绝机制的任何性质。但与此同时,由于中国的大学录取有其特殊性,即大学的偏好是同质的,而不是有限期的申请-拒绝机制假定的一般的大学偏好,因此又使得它具有了更一般的有限期的申请-拒绝机制不具备的特殊性质。所以,仍然有必要对照有限期的申请-拒绝机制,来讨论中国的分批次平行志愿机制。
我们结合下面的例子来说明。
例3.3 。中国的平行志愿机制。有四个学生:张三、李四、王五和刘六,有四所大学:A、B、C和D。每个大学只有一个录取名额。学生和大学的偏好如表9所示:
表9 大学录取市场中的偏好(之二)
注意,在这个例子里,所有学校对学生的偏好完全相同,符合“分数优先”。
首先,当e<∞时机制不稳定的结论依然成立,学生如实填报可能带来不稳定匹配。设e=2,若所有学生真实填报志愿,则匹配结果为:{(张三,A),(李四,B),(王五,D),(刘六,C)}。王五和学校C构成阻遏匹配(读者还可以验证有限期的申请-拒绝算法和中国的平行志愿算法得到相同的匹配结果)。
其次,也可以证明若e'=ke,k为大于1的正整数。则e'机制比e机制更稳定。只需要考虑增加两所学校:E和F。学生在上述偏好基础上,增加E和F为第5和第6偏好的学校。增加的学校仍然满足“分数优先”的排序,则e'=2e=4,学生说实话为稳定匹配,但e=2则不是。
更进一步,在上述例子中,若e=2,则学生说实话不是纳什均衡:如果其他人说实话,王五有激励偏离说实话,他说实话只能得到D,而偏离到以C为第一志愿可能得到C,好于D。这说明在有限期的申请-拒绝机制下的下列结论依然正确:随着e的增加,存在说实话均衡的可能性确实在(严格地)增加,即更大的e对应的有限期的申请-拒绝机制更抗操纵。实际上,在上述例子中,当e≥3时,所有人说实话就是纳什均衡。
在有限期的申请-拒绝机制下,我们发现随着e的增加,更有可能出现不稳定的纳什均衡。不过,在中国的平行机制下,我们却可以证明:无论e为多少,所有的纳什均衡都是稳定匹配。
证明如下。假定纳什均衡不是稳定匹配,则必然存在一个学生(例如张三)和一个学校A,构成阻遏匹配。首先,我们说明,学校A在纳什均衡下必须是录满的。这是因为,在中国的平行志愿(即分批次的序列独裁)机制下,因为不存在预录取,任何一个学校在任何一步一旦录满,就退出系统。如果大学A在纳什均衡下未被录满,则在所有录取轮次和步骤中,它从未出现过录满学生的情况。那么,张三将大学A作为第一批(轮)的第一志愿,必然会被大学A(在第一轮结束后)录取。
其次,假定学校A是录满的,则它必然最终录取了一个学生李四,其分数(或者说,所有学校共同的偏好)低于张三。学校A在某一步收到李四的邀约前,要么(i)录取了分数低于李四的学生,要么(ii)仍有空余名额。如果是(i),则它在第一轮(即考虑学生第1到第e志愿的完整轮次)结束时,必然有空余名额。如果是(ii),则它在第一轮录取结束时,要么有空余名额(ii-a),要么必然录取了李四或者比李四分数还低的学生(ii-b)。在上述所有(i)、(ii-a)、(ii-b)的情况下,张三将学校A作为第一轮的第一志愿都能被录取。以上分析证明了,如果纳什均衡结果不是稳定匹配,必定存在一个学生(张三),将与他构成阻遏匹配的学校作为第一批次的第一志愿,且必定会被录取。
以上分析表明,中国的平行志愿机制等价于有限期的申请-拒绝机制。它是一族机制,从一端的IA-BOS机制到另一端的DA-GS机制,即随着预录取的周期延长,机制会变得越来越稳定,这既是指在说实话前提下,机制更容易实现稳定匹配,也是指机制更抗操纵,即说实话更容易构成均衡。
3.4.3 实证证据
陈岩和凯斯滕(2017)的文章提供了一些实证证据证明他们的理论结果。由于并不能观察到学生的偏好,所以难以判断学生是否提交了真实的偏好,也无法直接判断匹配结果是否稳定。他们不得不依赖于一些更间接的观察。
第一,他们将四川从2008年的非平行志愿(即IA-BOS机制,e=1)到2009年的平行志愿(e=5)作为自然实验进行检验,结果发现,四川在2009年于第一批次引入平行志愿(即从e=1到e=5),使得学生提交的偏好序的长度平均增加了一个学校,将本地学校(本地学校可能优先录取本地学生)作为第一志愿的概率下降了4个百分点,同时第一志愿学校的质量上升了5个百分点(他们将学校质量从0到1排序)。此外,第一志愿录取率却显著下降了24个百分点。这被作为抗操纵上升的证据。
第二,利用上海从2007年的IA-BOS机制到2008年的平行志愿机制(e=4),他们发现学生拒绝上录取他们的大学的概率显著下降40.6%。四川、湖南(2009—2013年)的证据显示“合理的嫉妒”(Justified Envy)有所下降或至少没有上升。湖北(2010—2011年)的证据显示有更高比例的高分学生被第一层级的高质量大学录取。这被作为匹配结果更稳定的证据。
陈岩和凯斯滕(2019)的文章进一步用实验方法检验了三种机制IA(-BOS)、DA(-GS)和PA(即平行志愿机制)的匹配性质。他们发现,参与者最有可能在DA下如实报告他们的偏好,其次是PA,然后是IA。虽然稳定性比较也遵循相同的顺序,但效率比较因环境而异。无论指标如何,PA的性能都稳健地处于IA和DA之间。此外,53%的受试者在PA下采用了保险策略(即在IA机制下填报均衡结果中的学校作为安全选项,也是在靠前的偏好中更理想的选项),使他们至少与IA下可以保证的结果一样好。
无论是陈岩和凯斯滕描述的有限期的申请-拒绝机制,还是本文描述的中国平行志愿机制,都仍然有一个方面和现实中的平行志愿机制不同:在上述两种机制下,学生填报的全部志愿(即从第一志愿到最后一个可能的志愿)是完全没有限制的,学生可以把他能接受的学校按任意顺序排列,但在中国高考制度下,我们一般实行的是“批次志愿”。虽然每个批次可能类似这里的“轮次”,但“批次志愿”并不允许在每个批次中填报任意学校,而是规定了在每个批次可以填报的学校范围。极端地说,一个认为自己只能上“二本”学校的人,并不能在第一批次中填写“二本”的某个学校。他要么干脆不填任何学校,等待第一批次录取结束后加入第二批次,要么就填写一些一本学校,虽然大概率无法被录取。这样一种有限制的批次录取相对于作者提出的无限制的批次录取,也许对高分考生是有利的,因为他们不用担心在第一批次落榜之后,第二批次(即“二本”)的学校已经被占据。对于这种有限制的批次录取,目前还没有见到系统性的研究。
这再次表明理论和现实存在差距。尽管如此,通过提炼现实制度的某些最为重要的特征,深入的理论分析至少为我们提供了解释现实、认识现实制度的若干参照系,为我们理解和评价现有机制,以及后续设计更好的解决方案提供了指导。