首页
文章
中央毕业考试提高了学生的成绩

中央毕业考试提高了学生的成绩

校外毕业考试提高了学生的成绩，并改善了劳动力市场对成绩的理解

慕尼黑大学，ifo研究所，CESifo和IZA，德国

单页全文

电梯游说

通过向学校系统增加资源来实现提高学生成绩的政策目标往往被证明是难以实现的。相比之下，大量证据表明，中央毕业考试是学校系统制度框架的一个重要特征，它可以让学生、教师、学校和管理人员对学生的成绩负责。尽管批评人士指出了一些问题，比如只教应试技能，这可能会让学生对现实世界准备不足，但证据并没有证实这一点。总的来说，中央考试与更好的学生成绩、有利的劳动力市场结果和更高的经济增长有关。

重要发现

优点

在国家和地区学校系统中，中央考试与学生成绩的显著提高有关。

中央考试是分权系统和自主学校取得高学生成绩的先决条件。

中央考试与较高的收入、较低的失业率和较高的等级信息价值在劳动力市场有关。

中央考试所刺激的技能提高与国家更高的长期经济增长有关。

缺点

中央考试提高了测试的基于课程的技能，但不一定是其他技能维度。

在一门学科上强调更高的学习成绩可能会以牺牲学习的乐趣为代价。

仅仅是最低能力考试或课程毕业要求不足以产生基于课程的中央退出考试系统的效果。

关于如何最好地实施中心考试以及哪些要素至关重要的许多细节仍然知之甚少。

作者的主要信息

中央考试作为一种问责机制，揭示了学生和学校努力的总体结果。中央考试可以增加学习的外部奖励，加强对教师和学校的监督，并减少同侪对学习的压力。它们改善了学生的学习成果和他们随后在劳动力市场的表现，并提高了对成绩的理解——他们在劳动力市场上的信息价值。因此，在中学结束时实施中央考试可能比许多其他资源密集型教育举措更有效地改善学生的成绩。

动机

教育成就是个人在劳动力市场上取得成功和整体经济增长的主要决定因素。然而，事实证明，在学校系统中很难设计出能够成功提高学生教育成绩的政策举措。特别是，关于通过增加开支或缩小班级规模来增加学校系统资源的效果的证据通常令人失望。相比之下，越来越多的证据表明，学校系统的制度结构为利益相关者提供激励，使他们专注于提高学生成绩，这与塑造学生成绩高度相关[1]．制度框架的一个重要方面是是否——如果是的话，如何——在学校系统中对学生的表现进行检查。特别是，大量证据表明，中央考试可能是将注意力集中在学生成绩上的一种有效手段。

正反两面的讨论

定义中心考试

区分学校制度的一个关键制度特征是，学生在完成中学学业时，是通过中央考试还是地方考试来评估他们的学习成果。中央毕业考试系统(简称为中央考试)的主要特点是所有学生必须参加相同的期末评估，这些评估是为系统内所有学校开发的，从而增加了全国或州内成绩和学位的可比性。

更详细地，强调了这类系统(也称为基于课程的外部退出考试系统)的六个关键方面的特征[２]首先，它们产生学生成绩的信号，对学生有实际的影响。其次，他们根据外部标准来定义成就，而不仅仅是与教室或学校里的其他学生进行比较。第三，它们是按学科组织的，并与特定课程序列的内容有关。第四，它们表明了不同程度的成就，而不仅仅是一个及格/不及格的信号。第五，他们覆盖了几乎所有的中学生。最后，他们考查了学习这门学科的学生应该掌握的大部分知识。

虽然中央考试使用标准化考试，但这六个特点表明，这些系统不仅仅是执行这些考试，相反，并不是所有的标准化考试都构成这里所采用的中央退出考试。中央考试的内容是指学校课程中所教授的内容。以课程为基础的考试意味着为学生在学校努力学习创造了动力。这与美国SAT等大学入学考试形成了鲜明对比，后者更接近于捕捉学生的天赋，而不是在学校的实际学习情况。有中央考试的国家包括英国、法国、日本、韩国和荷兰，而比利时、西班牙和瑞典则是没有中央考试的国家。在加拿大和德国，一些省/州有中央考试，而另一些没有。在美国，纽约州是唯一一个将离职考试列为此类的州。

理论框架

从理论角度来看，中央考试可能通过至少三种机制影响学生的学习成果和劳动力市场表现:增加学习的外部奖励，加强对教师和学校的监督，减少同侪对学习的压力[3]．这些机制最终依赖于这样一个观点，即中央考试提供了学生学习成果的信息，而这些信息在其他情况下是无法获得的。通过这种方式，它们可以作为一种问责机制，揭示学生和学校努力的总体结果。所谓的教育生产委托代理模型预测，制定明确的绩效标准和提供绩效信息可以使激励倾向于更好的学生表现。

参考这三种机制中的第一种，中央考试可以让潜在的雇主和高等教育机构更好地认可学生的教育成就。这是通过使学术证书成为学习内容和成就水平的更精确的信号来实现的，这样雇主就愿意为更好的成绩支付更高的工资。因为学生和他们的家长都知道这一点，集中考试增加了学生学习的外部奖励，从而为学生增加学习努力创造了更强的动力。

其次，通过提供有关教育成果的信息，中央考试可以改善对教师和学校行为的监督。改进监测可以减少教育过程中的低效现象，提高教育成果。特别是，中央考试引入的问责制可以帮助建立激励机制，鼓励学校人员以促进学生学习的方式行事，而这些方式不一定符合他们自己的利益。例如，如果没有正确的激励，教师使用他们认为最方便的教学方法，即使这些方法对学生的影响可能不是最大的。然而，在中央考试的成绩信息被用作监测工具的国家，教师可能主要关注提高学生的成绩，从而把其他不太有成效的兴趣放在一边。

第三，中央考试也可以减少集体学习压力。当分数分配相对于班级平均水平时，学生的最佳集体策略是降低班级的标准。这意味着学生有动力对班上的其他人施加同伴压力，让他们不要太好学，也会分散老师的注意力，因为这意味着学生需要更少的努力才能获得相同的成绩。中央考试使得这种集体策略无效:同侪诋毁好学的动机消失了，因为糟糕的课堂作业只会导致所有人的分数下降。同样，这种机制可以提高学习效果。总而言之，中央考试可以让学生和教育提供者对他们的学习和教学负责，从而提高学生的成绩，并最终提高劳动力市场的结果。

中央考试对学生成绩的作用的证据

大量的实证文献研究了中央考试如何影响学生的教育成就。来自国际学生评估项目(PISA)和国际数学与科学趋势研究(TIMSS)等几项国际学生成绩测试的证据显示，中央考试与各国学生成绩之间存在一致的正相关关系[1]．现有的跨国证据，如所描述的插图的研究表明，中央考试和学生成绩之间的联系可能与整个年级水平相当。早期的研究使用国家层面的汇总数据来研究国家层面的中央考试与成绩分数之间的关系[２]．随后的研究使用了个别学生的微观数据[4]，在考虑到大量学生和学校背景因素的影响下，他们可以比较各国观察上等效的学生。

这些微观数据提供的每个国家的学生水平差异也可以用来分析中央考试与学生成绩之间的关联是否具有某些特征[1]．因此，这些结果表明，这种影响倾向于随着学生能力的增加而增加，它与大多数家庭背景的测量方法没有区别，它在中等教育过程中增加，并且它随着定期使用标准化考试而增加。此外，正如下面将讨论的那样，中央考试的作用是补充学校自主权的各个方面。

解释跨国关联的一个限制因素是未观察到的国家特征，如特定的文化，可能会带来偏见[1]．例如，一个社会可能会引入中央考试，同时也会鼓励学生以其他富有成效的方式学习。因此，中央考试和学生成绩之间的正相关并不一定反映出因果关系。

有许多方法可以调查这种文化影响对中央考试和考试成绩之间的联系是否重要[1]．一种方法是将测试分数和考试差异的研究限制在大陆层面。如果国际考试分数的变化被某些大陆更相关的特征所偏向——比如，如果亚洲国家比其他地方更重视教育成功——那么在一个用大陆固定效应解释这一问题的模型中，中央考试的系数就会下降。然而，中央考试和学生成绩之间的联系已经被发现是稳健的，包括大陆固定效应，因此对这一特定的理论提出了质疑。

另一种方法比较了德国各州和经合组织国家之间的差异。这种策略很有用，因为直到21世纪初，德国16个州中只有7个州实行中央考试。然而，在其他方面，德国各州与经合组织国家更为相似。这种方法表明，在有中心考试的系统中，学生的成绩水平明显更高(图1)。此外，经合组织和德国样本之间的这种关联在统计上难以区分［5］，这表明，经合组织数据中所显示的国际关联不太可能是由文化、语言或其他德国内部没有差异的制度环境所驱动的。加拿大各省和美国各州也发现了类似的中央考试与考试成绩结果的跨地区关联。

德国各州和经合组织国家的中央考试和学生成绩

另一种方法是利用德国数据，利用学校科目之间的差异，采用“差异中的差异”方法[6]．具体来说，德国大多数州都有数学考试，但没有科学考试(相关科目)。这里的关键假设是，在没有中央考试的情况下，不同州的学科之间的成绩差异不会有变化。这种方法的估计是重要的和实质性的，这表明中央考试确实提高了特定科目的考试成绩。此外，在学科之间存在溢出效应的情况下，这些估计值为中央考试的全部潜在影响提供了一个下界，例如，由于中央考试的存在而提高的数学知识有助于学生在科学方面的学习。

在2001年之前，德国只有不到一半的州实行了中央考试，但从那以后，除了一个州之外，其他州都引入了中央考试。2011年的一项研究利用2000年至2006年的德国扩展PISA波，采用“差异中差异”的方法，研究了各州和学校类型引入这些标准的不同时间[7]．明确的假设是，如果没有中央考试的引入，就不会有不同的成绩趋势。结果表明，即使在短期内，它们的引入也产生了积极的影响。

中央考试对劳动力市场作用的证据

有充分的证据表明，中央考试的影响超出了学校体系，影响到了长期的经济表现。在宏观经济层面，一项研究使用中央考试的存在作为一个国家平均学生成绩的工具，来比较各国的经济增长。研究发现，由于中央考试的存在，学生成绩的变化与各国实际人均GDP的长期增长之间存在显著的正相关关系。

在个人层面上，更好的学术测试成绩被发现与更高的劳动力市场收入显著相关。鉴于中央考试对此类考试成绩产生积极影响的大量证据，这提供了间接证据，表明中央考试可能通过提高教育成就对收入产生积极影响。

但是，也有人主张，外部测试也有可能带来负面影响，因此要谨慎。例如，以考试为基础的问责制可能只提高应试技能，而不是真正的教育成就;或者，甚至更进一步，这些系统可能会诱导欺诈行为，如彻底的欺骗。最近的一项研究在一定程度上消除了这种担忧，该研究利用了各国在中央考试中存在的差异，发现参加过中央考试的人在成年后确实拥有更高的技能水平[8]．

尽管如此，一项研究表明，虽然中央考试确实提高了学生的学习成绩，但却对他们的学习态度产生了负面影响，这从学生自我报告的对数学的喜爱程度就可以看出[9]．另一项关于德国的研究表明，中央考试对基于课程的知识的积极影响并没有延伸到对数学素养的另一种衡量方法的积极影响，这意味着通过中央考试获得的技能可能是针对所测试的课程而不是更普遍适用的[10]．

为了提供直接证据，证明中央考试带来的考试成绩提高是否真的会转化为更好的劳动力市场结果，另一项研究再次利用了这样一个事实:德国各州(直到最近)在使用中央考试方面几乎平分秋水[11]．该研究使用了一个数据集，将个别学生的考试类型(即中央或地方)与他们后来的劳动力市场结果联系起来，比较了同一德国劳动力市场中来自两种不同类型学校系统的工人的结果。

研究发现，来自最低级别学校的学生往往在中学毕业后直接进入劳动力市场，如果他们持有一个州的中学证书，他们的收入确实更高。此外，鉴于德国劳动力市场相当僵化，收入结构主要由中央谈判决定，无论是低级别还是高级别学校的毕业生，如果参加中央毕业考试，他们的失业率都较低。平均而言，参加集中考试的低档学校毕业生的收入比未参加集中考试的毕业生高约12%，失业概率比未参加集中考试的毕业生低约4个百分点，参加集中考试的高档学校毕业生的失业概率比未参加集中考试的毕业生低2.5个百分点。虽然这些结果必须被视为描述性模式，而不一定是因果关系，但它们与理论预测一致，即中央考试对劳动力市场有相当大的影响，特别是当毕业生离开学校直接进入劳动力市场时。

利用相同的德语环境，另一项研究旨在直接测试在中央考试中获得的分数是否确实与劳动力市场中较高的外部奖励相关，这是上述中央考试效应潜在机制之一的必要条件[12]．这项调查比较了高中和初中成绩不同的人的收入，取决于他们是在实行中央考试还是地方考试的州取得成绩。主要结果描述在图2该软件将平均月收入与中央考试州和地方考试州的成绩分开绘制。在实行地方考试的州的毕业生中，成绩好与收入之间只有轻微的正相关关系。相比之下，在中央考试州取得好成绩的毕业生的收入回报很高。更具体地说，该研究发现，如果在中央考试州取得成绩，一个标准差的成绩提高意味着大约6%的收入增加，而在地方考试州取得成绩则不到2%。使用一个模型来解释这些结果，在这个模型中，分数是实际生产力的容易出错的代理，与中央考试成绩相比，地方考试成绩似乎提供了一个更嘈杂的生产力衡量标准。成绩提高带来的收入差异超过4个百分点，这表明在劳动力市场上，中央考试比地方考试具有更高的信息价值。

中央考试的信息价值较高

这一发现与中央考试提供的更好的信号能提高学习的外在奖励的观点是一致的。根据这一推理，这是因为中央考试与外部标准具有可比性，这可以更好地向高等教育机构和潜在雇主传达学术成就。因此，在决定录取和招聘时，他们将更加强调教育成就。因此，他们的决定对其他因素变得不那么敏感，比如家庭关系、短期工作面试的特定环境、相对于阶级平均值的表现，或者更看重先天能力而不是整体教育成就的能力倾向测试。然后，学生就会对更高的学习奖励做出反应，增加他们的学习努力。总而言之，在中央考试中获得的中学毕业成绩与收入有更强的联系，这一事实增加了学生的学习动机。

中央考试如何与学校自主互动

基于国际学生成绩测试的跨国证据，突显了中央考试效果不同的一个重要方面:学校在多大程度上拥有自主权，努力以最佳方式提高学生成绩[1]．一方面，学校自治可能会对学生的成绩产生积极影响，因为地方决策者往往更了解情况。另一方面，地方决策者可能会采取机会主义行为，特别是在他们的利益与提高学生成绩并不严格一致的决策领域——除非他们对学生的成绩负责。因此，如果学校没有动力把注意力集中在改善学生成绩上，地方自治可能会导致学生成绩更差。相比之下，当中央考试通过提供学生最终表现的比较信息来要求学校对学生的成绩负责时，与学校自主权有关的消极方面应该得到缓解，更大的自主权可能会带来更好的结果。

与这一推理思路一致的是，国际上的证据表明，学校自主权的影响与中央考试之间存在着显著的相互作用。在一些决策领域，在没有中央考试的系统中，自主性与学生成绩呈负相关，但在有中央考试的系统中呈正相关。一个这样的例子，提到学校对教师工资的自主权，描述在插图．在其他决策领域，如学校在设置课程内容方面的自主权和教师对资源资助的影响，也发现了与使用中央考试有关的类似积极相互作用。

考虑到主流的经济理论，这种结果模式在直觉上很有吸引力。然而，关于学校自主权的经验证据只是描述性的，并不一定能捕捉到因果效应。2013年的一项研究在这方面取得了进展，它构建了一个由42个国家组成的面板数据集，这些国家是在2000年至2009年的四波国际PISA测试中观察到的[13]．该研究通过考察在学校运营的关键要素上拥有自主权的学校在国内平均份额的变化，确定了学校自主权对学生成绩的影响。结果表明，在发展中国家和表现较差的国家，自主性对学生成绩有负面影响，但在发达国家和表现较好的国家，自主性对学生成绩有正面影响。此外，该研究证实，在实行中央考试的国家，学校自治的效果明显更为积极，这表明，当有足够的外部问责制来限制学校的机会主义行为时，地方决策可能确实会更好地发挥作用。

局限性和差距

根据定义，中央考试是整个学校系统的一个特征，任何分析所依据的变化都是有限的。虽然跨国家和跨区域的分析提供了相当一致的结果模式，但系统特征的影响本质上很难从计量经济学上确定。此外，考试制度不是随机分配给个人、学校或国家的，这意味着必须从观察数据中确定影响。差异中的差异模型证实了横断面结果，但精确识别因果效应仍然是一个挑战。

我们需要更多地了解有效的中央考试系统的最重要组成部分。有证据表明，基于课程的中央退出考试系统比仅仅是最低能力考试和课程毕业要求有效得多。然而，研究人员对考试重要性的理解是基于课程而不是测试能力，这可以从额外的分析中受益。

由于在系统级分析中可用的自由度有限，它们通常可以揭示广泛的模式。这意味着具体实现问题的许多细节仍然是开放的。因此，对于中央考试系统的哪些细节对确保有益效果最为重要，人们所知甚少。例如，各国在涵盖学科的广度、在确定离校年级时中央评估和以教师为基础的评估的组合、在与考试结果相关的利害关系、以及在中央考试与较早年级的集中测试相结合的程度上存在差异。这些差异对学生成绩的影响程度是未来研究的一个重要方向。

摘要和政策建议

来自国家内部区域差异的证据以及来自国际学生成绩测试的跨国证据表明，当学校系统中有中央考试时，学生在成绩测试中表现更好。尽管批评人士声称，中央考试可能会把教学精力集中在考试中测试的内容上，而牺牲了其他科目和技能，但最近的证据表明，中央考试也与更好的劳动力市场结果有关。此外，中央考试成绩比地方考试成绩具有更高的劳动力市场信息价值。此外，中央考试与学校自主权有积极的相互作用。

因此，中央考试可以成为确保学校系统取得高成就的重要政策工具，尤其是在许多其他政策举措已被证明无效的背景下。与此同时，政策制定者应确保考试形式具有足够的创造性和灵活性，不受应试技能的影响。此外，考试的内容应该足够广泛，以涵盖学生进入劳动力市场时所期望的技能范围。在最终的离校年级中，将中央考试组成部分与教师评分混合在一起，可能会平衡外部效度与基于长期观察的教师评估。根据现有的证据，中央考试似乎是在整个系统中提高学生教育成就的一种非常有效的手段。

致谢

作者感谢IZA劳动世界的编辑们为早期的草稿提供了许多有用的建议。作者以前的作品包含了本文所介绍材料的大量背景参考资料，并在本文的所有主要部分中被大量使用[1]．

相互竞争的利益

IZA劳动世界项目致力于IZA研究诚信指导原则．作者声明他遵守了这些原则。

证据地图

中央毕业考试提高了学生的成绩

中央毕业考试提高了学生的成绩

校外毕业考试提高了学生的成绩，并改善了劳动力市场对成绩的理解

电梯游说

重要发现

优点

缺点

作者的主要信息

动机

正反两面的讨论

定义中心考试

理论框架

中央考试对学生成绩的作用的证据

中央考试对劳动力市场作用的证据

中央考试如何与学校自主互动

局限性和差距

摘要和政策建议

致谢

相互竞争的利益

证据地图

财政激励对教师的效果如何?

大学自治:提高教育产出

操纵考试成绩如何影响学校问责制和学生成绩

教师认证是发展中国家的有效工具吗?

了解教师提高学生成就的有效性

中央毕业考试提高了学生的成绩

校外毕业考试提高了学生的成绩，并改善了劳动力市场对成绩的理解

电梯游说

重要发现

优点

缺点

作者的主要信息

动机

正反两面的讨论

定义中心考试

理论框架

中央考试对学生成绩的作用的证据

中央考试对劳动力市场作用的证据

中央考试如何与学校自主互动

局限性和差距

摘要和政策建议

致谢

相互竞争的利益

证据地图

完整的引用

完整的引用

数据源(年代)

数据类型(年代)

方法(年代)

国家