2018年7月

IZA DP No. 11683:测试

即将出版于:人力资源杂志

学校系统经常使用学生评估来达到问责的目的。但是,正如我们的概念模型所强调的那样,不同的评估使用配置为不同的学校环境中的不同利益相关者产生了不同强度的绩效激励。我们建立了一个来自59个国家的200多万名学生的数据集,在2000-2015年的国际PISA学生成绩测试中观察了6次。我们的实证模型利用国家面板维度来调查评估系统随时间的改革,其中的识别来自于排除国家和年份的固定影响以及一系列丰富的学生、学校和国家措施。我们发现,无论是基于学校还是基于学生的标准化外部比较,都与学生成绩的提高有关。在最初表现较低的国家,基于学校的比较效果更强。同样,没有外部比较的标准化监测对最初表现不佳的国家也有积极影响。相比之下,仅仅引入内部测试和内部教师监督(包括督察)并不会影响学生的成绩。我们的研究结果指出了从特定国家的测试系统中过于宽泛的概括的缺陷。