IZA劳动世界-评估公共服务的效率

单页全文

电梯游说

对于管理公共服务的人来说，效率是一个重要考虑因素。成本随产量和其他各种因素而变化。以高等教育为例，影响因素包括质量、学生人口统计、高等教育提供者的规模和范围，以及房地产的规模和性质。但即使考虑到所有这些因素，由于效率的差异，不同供应商的成本也有所不同。这些差异提供了关于良好实践的线索，可以导致整个系统的改进。效率的作用是通过参考英国高等教育机构来说明的。

重要发现

优点

审查公共服务的成本提供了一个宝贵的证据基础，为旨在更深入地分析效率的案例研究提供信息。

衡量效率的差异有所不同，但差异可能对政策制定有指导意义。

建议的统计方法(潜在类别的前沿分析)直接将效率与已知的公共服务提供费用和影响费用的因素联系起来。

这种方法适用于规模和范围的概念，这对考虑资源集中和合并活动是很重要的。

缺点

潜在类方法不允许精细的分解，具有高度相关的变量或有限的自由度。

潜在阶级方法不一定会产生直观上吸引人的机构分类。

估计效率是基于统计误差的不对称，因此围绕中心估计的置信区间可能很宽。

效率的概念依赖于关于什么成本差异可能是允许的主观决定，但应用统计方法可能会加强这些判断。

作者的主要信息

政策制定者需要可以用来评估公共服务效率的信息。尽管在效率的定义中存在一些价值判断，但数据可以提供有关服务提供商相对效率的有用线索。由于可用数据有限，如果统计方法考虑到提供者在某些方面存在差异的可能性，而这些差异并不明显(因为可用数据有限)，则可以揭示测量效率的差异。用于评估公共部门服务提供者效率的工具，可以对纳税人的钱的使用情况进行重要检查，并可被政府广泛应用。

动机

政府的主要职能之一是提供公共产品和公共服务。在竞争激烈的行业中，供应商面临着以尽可能低的成本(在给定的质量水平上)将投入转化为产出的压力。这种压力促使他们提高效率。在竞争市场缺乏通常纪律的情况下，例如在提供公共服务方面，评估效率是很重要的。关于效率的透明度可以告知选民，他们可能希望支持在这方面有良好记录的政党。此外，确定高效的提供者可以通过认可和传播良好做法来提高效率。

一个可以说明如何评估公共服务提供效率的例子是英国的高等教育，它由包括学费在内的公共和私人资金混合提供资金，并且受到严格监管。在某些方面，供应商之间的竞争非常激烈。在其他国家，竞争的影响被一套复杂的制度所削弱。从整体上看，假设该行业的供应商是高效的是不合理的。相反，因为高等教育提供者的效率程度是一个经验问题，所以衡量它很重要。

这里报告的研究主要基于英国商业创新和技能部的工作［1］．它在很大程度上依赖于几种早期的方法论发展[２]，［3］，[4]，［5］．

正反两面的讨论

细化常规模型

分析中采用的基本方法是对解释高等教育机构成本的模型进行统计估计。该方法在几个方面不同于传统的回归分析。传统的回归模型估计一条最佳拟合线——一条经过或最接近变量之间关系的估计值最多的点的线。为了估计公共服务的效率，估计曲线比估计直线更合适，因为曲线更灵活，可以考虑到数据的重要特征，如规模经济。由于有几种类型的提供者——在这里是高等教育机构，具有不同的学科重点和任务——因此估计多条曲线是合适的。此外，估计提供绩效有效前沿位置的曲线是合适的，这是一种可能的测量，而不是最佳拟合，这提供了平均绩效的测量。成本函数是一个边界，在给定的产出水平下，成本不可能下降。超出边界的成本代表效率低下。

由于这些原因，传统的线性回归技术在估计公共服务提供效率方面有三种改进方法。

首先，使用非线性而不是线性的泛函形式;在非线性泛函形式中，允许输出和输入之间的关系随比例变化。
其次，应用了“潜在类别”方法，以便为多个提供者类别中的每个类别拟合单独的回归曲线，数据(而不是分析师)根据统计似然性确定哪些提供者属于哪个组。
第三，使用随机前沿方法，将统计残差(数据与最佳拟合线的随机偏差)分离为两个分量——代表成本无效率和传统的统计测量误差——以取代回归曲线，使其代表高效提供者面临的成本曲线[6]．

图1用一个简单的模型说明了估算成本函数的方法，该模型使用单个输入变量来衡量产出，成本取决于总产出水平。图中的每个圆圈和菱形表示一个提供者，每个观察点的位置表示提供者以何种成本生产了多少输出。散点图显示，产出和成本之间存在正相关关系——较大的供应商比较小的供应商产生更大的成本——但这种相关性相当弱。

产出和成本之间的关系:两类机构的散点图和成本边界

如果对两组不同的提供者(这里用圆形和菱形表示)估计相关性，则提供了更强的拟合。这两个组中的每一个都由一些独立的提供者组成，但是每个组中的提供者都有一些(不可观察的)共同特征，但在组之间又有所不同。钻石的成本通常高于圆形，并且(在大多数情况下，尽管不是在非常低的产量水平上)随着产量的增加而急剧上升。虚线表示产出和成本之间的关系，提供了与数据的最佳拟合。实体曲线代表了每一类供应商的成本边界;为了显示每个类中高效提供者的成本计划是什么样的，将这些从最合适的关系中替换出来。

以英国高等教育机构为例

为了说明如何使用这种方法，请考虑英国高等教育机构的情况。这些院校培养不同学科、不同层次的毕业生，包括本科生和研究生。他们还进行研究，与更广泛的商业社区和其他组织进行知识转移和其他活动。不同机构参与每一项活动的程度差别很大。一些机构非常注重科学和工程，另一些则注重创意艺术。有些国家有医学院，有些国家没有。一些机构是高度研究密集型的，而另一些则有更强的教学使命。一些学校主要侧重于本科教育，而另一些学校则更广泛，有大量的研究生。

机构的这些特征都可以用成本数据作为因变量，每个学科组的本科生和研究生人数、研究收入和知识转移活动(以知识产权收入衡量)作为解释变量来捕捉。下面估算的成本非线性模型包括每个解释变量中的线性项和二次项(捕捉规模回报率)，以及一组交互变量(捕捉范围回报率)。交互变量是所有学数变量的双向乘积，每个学数变量与研究之间的双向乘积，以及研究和知识转移变量的乘积。此外，该模型还包括控制变量，这些控制变量捕捉了每个机构房地产的性质(特别是在特殊建筑或历史利益建筑法定清单上的建筑物所覆盖的区域)和学生入学的性质(特别是来自低参与度社区的学生数量)作为解释变量。

说明示例中使用的数据

英国高等教育统计局(HESA)提供了三个主要学科领域(医学、其他科学和其他学科)以及本科和研究生水平的全日制同等学生人数的数据，以及成本和研究收入的数据(缩减至2011年的值)。虽然人们认识到，研究收入可能是研究活动的不完美衡量标准，但提供了这一衡量标准与其他指标之间高度相关的证据［1］，包括从Web of Science()获得的发表量和引用量。知识产权收入的数据(扣除2011年的价值)来自高等教育商业和社区互动调查。HESA还提供了各大学注册建筑所占面积(平方米)的数据，以及来自高等教育参与率较低社区的年轻全日制本科生人数。后一个变量的目的是计算由于这些学生的中学教育经验对高等教育的准备程度存在差距而产生的任何额外费用。这最后两个变量对成本影响的细节在本文中没有报道，但它们都在预期的方向上影响成本。非线性模型也适用于牛津大学和剑桥大学。

利用Limdep软件估计了用于获得本文报告结果的潜类随机前沿模型。

翻译结果

由于模型包括非线性和交互项，估计练习的结果不能直接解释。然而，该模型允许估计与每种产出类型相关的平均增量成本(所有变量的平均值)。这些指标表明，对于每种产出类型(医学本科生、其他科学本科生等等)，在给定每种其他产出类型的平均生产水平的情况下，平均生产单位增加了多少总成本[7]．

图2报告通过使用2008/2009年至2010/2011年汇集的数据，估计非线性随机前沿模型的两个版本获得的平均增量成本。第一列报告了从一个简单的模型中获得的平均增量成本，在这个模型中，所有解释变量的系数(或权重)在所有提供者中都假定为常数。另外两列显示了存在两个潜在类别的情况下的平均增量成本——也就是说，假定高等教育提供者属于这些类别中的一个或另一个，数据用于根据最适合数据的类别成员模式来决定哪个提供者属于哪个类别。在每种情况下，报告的平均增量成本为一个机构产生的平均(在类内)水平的每项产出。

2008/2009-2010/2011年，根据两个非线性随机前沿模型估算的英国大学平均增量成本(英镑/年)

报告的平均增量成本模式图2符合直觉。在本科学科中，提供医学教育的成本最高，其次是其他科学。潜在阶级模型表明，某些类型的供应成本在不同机构之间可能差别很大;在潜在等级2的机构中，科学以外的学费成本非常低，但这由科学，特别是医学方面的更高成本所弥补。

然而，在解释这些结果时需要一定程度的谨慎，因为它们是基于一组统计系数，并不是所有的统计系数都得到了精确的估计。主要信息是，不同学科和不同大学的成本各不相同。

计算每个供应商的效率分数

平均增量成本与边际成本之比通常被用作规模回报率的概括衡量标准。如果这个度量值高于1，则可以观察到规模经济;如果该指标低于1，规模经济就会耗尽。图3报告与中考虑的每个模型的每个输出类型相关联的特定于产品的返回图2，以及Ray的规模收益(与所有产出的同时增加相关的收益)。

从两个非线性随机前沿模型估计的英国大学规模经济和范围，按产出类型，2008/2009-2010/2011(磅/年)

图3还报告了全球范围回报的度量，其构造为多个产品的联合生产成本与它们的单独生产成本之间的差额占联合生产成本的比例。如果该度量值超过零，则存在未实现的范围经济;如果它是负的，那么范围经济就被耗尽了。

一旦估计了成本边界，通过计算每个提供者的统计残差的非对称部分来评估每个提供者的效率得分就变得很简单了。这相当于比较前沿曲线的位置图1与服务提供商的成本和产出的观测值(控制正常剩余)。如果供应商以大大高于成本边界所证明的可行成本的成本交付给定数量的产出，那么该供应商大概有提高效率的空间。

幸运的是，已经开发了一种方法来解开剩余成分，从而允许计算每个机构的效率分数[8]．这个效率分数是这样构造的，一个非常高效的提供者的分数将是1;效率较低的提供者得分较低。

研究结果发表于图3最近的其他研究发现，与教育产出相关的规模经济往往会枯竭或接近枯竭，而与研究相关的规模经济则不会枯竭［1］．然而，应该指出的是，与医学专业学生相关的规模回报略高于与其他学科学生相关的规模回报，这表明在这一领域集中提供服务是值得的。此外，知识产权的产生和转让似乎具有规模经济效应。与其他使用前沿方法的研究一样，这里没有全球范围经济的证据。

从没有潜在阶层的随机前沿模型中获得的效率分数分布表明，英国的高等教育机构在很大程度上是相当高效的。约72%的机构的效率得分为0.85或更高。在有两个潜在阶级的模型中，这一比例上升到76%——这并不奇怪，因为潜在阶级模型考虑到了机构之间一些未观察到的异质性。

虽然许多机构在这一指标上表现良好，但有少数机构的效率得分要低得多。这些都是相对较小和高度专业化的机构:例如音乐学院和艺术学校。这类机构通常面临着异常高昂的成本，因为针对特定学科的定制供应需求;例如，音乐和艺术专业的学生需要提供专门的工作室空间。这一观察结果很好地说明了前沿分析中的低效率分数并不一定提供低效率的证据，但它确实指出了定量分析可以用更定性的研究进行有益补充的领域。此外，在分布的上半部分可以观察到明显相似的提供者之间的效率分数的差异，对可能导致这些差异的因素进行定性调查，作为基准测试和传播良好做法的手段，很可能是富有成效的。

局限性和差距

在评估经济单位的效率时，分析师们受到一个相当明显的事实的阻碍，即他们只能观察实际存在的生产者。边界是由观察到的已知可能决定的，而不是由实际可能决定的。一些跳出框框的想法可能会提供比目前正在实现的任何解决方案都更有效的解决方案，但在本分析中没有考虑到这一点。因此，这个练习实际上是相对于当前最佳实践的某些衡量标准来评估每个生产者的效率，而不是相对于任何时间和空间都适用的理想实践。

估计成本模型的统计方法可以用参数来描述。它假设成本模型有一个特定的函数形式，并假设附加在每个变量上的权重在各个机构之间是恒定的，或者至少在每个潜在类别中的所有机构之间是恒定的。这些假设可能并不恰当。出于各种原因，不同的生产商可能面临不同的成本结构。研究——就其本质而言涉及新知识的创造——是独一无二的，因此在每个机构内所做的研究都是不同的，对成本也有不同的影响。同样地，每所大学都会招收有独特需求的学生，而这些独特需求可能会以不同的方式影响成本。

然而，有一些方法可以用来巧妙地解决参数化方法的局限性。事实上，潜在阶级模型在一定程度上有助于实现这一目标，同时也认识到不同机构之间存在一定程度的异质性。这里的讨论只考虑了两个潜在类的存在。相比之下，为英国商业创新和技能部开展的工作为各种模型提供了结果，最多可容纳四个潜在类别［1］．更全面的限制可以通过使用随机参数前沿模型来实现，该模型允许每个机构在模型中的变量上附加一个不同的权重向量，这很类似于一个潜在类别模型，有多少机构就有多少类别。在其他文献中也采用了这种方法[9]．或者，可以使用完全非参数的方法，如数据包络分析;这种方法避免了统计，而支持将线性规划作为确定每个机构可以瞄准的边界的手段[10]．

潜在阶级的组成是有趣的。考虑到英国高等教育机构群体的独特使命，人们可能会期望研究密集型机构聚集在一个潜在类别中，而教学密集型机构则集中在另一个潜在类别中。然而，在实践中，这些机构并没有以一种产生这种直观解释的方式将自己划分为潜在的类别——每个类别都包括研究密集型和教学密集型机构。虽然支持向类分配提供者的技术原因很清楚，但缺乏直观的基本原理。

从概念上讲，应该认识到效率的定义不可避免地是没有意义的。这是因为，在选择成本模型的结构时，分析师实际上是在声明某些变量是成本差异的合法来源，而声明模型中不包括的其他变量是不合法的。由于这些排除变量的差异而造成的机构间成本差异表现为效率差异。但是，在模型中选择哪些变量不可避免地是一种判断。

虽然这里报告的这种定量分析可以提供一个有用的概述，但应该记住，任何统计分析都有局限性。高等教育等公共服务的提供者在许多定性方面存在差异，而数据根本无法捕捉到这些差异。定量分析可以指出看起来有趣的提供者之间的差异，但这些需要进一步使用定性方法进行询问，以便获得更全面的情况，并确定效率上的明显差异是否确实具有指导意义，以及它们是否因此可以用于加强实践。

摘要和政策建议

统计方法可用于评估公共服务的效率，发现的差异可为良好做法提供线索。从随机前沿模型获得的效率分数分布表明，英国高等教育机构通常以高水平的效率运作。然而，也有一些机构的效率得分相对较低。这些都是小型专业机构。他们的成本可能超出了边界，至少部分超出了边界因为它们规模小(因此无法利用规模经济)、专业化(因此面临特殊成本)。在这些情况下需要进行定性研究，以更准确地确定其高费用背后的决定因素。既然规模回报率很重要，就应该考虑把合并作为实现效率的一种手段。

在较大的机构中，测量效率的差异相对较小，但存在的差异可能具有指导意义。进一步的调查，包括定性分析，可以揭示良好的做法，并通过基准，可以使整个系统在如何将投入转化为产出方面得到改善。

更一般地说，用于评估公共部门服务提供者效率的一套工具对纳税人的钱的使用情况提供了重要的检查。因此，前沿方法应该在政府中广泛应用。

致谢

作者感谢一位匿名的推荐人和IZA劳动世界的编辑们为早期的草稿提供了许多有用的建议。这篇论文广泛地借鉴了作者以前的著作［1］．

相互竞争的利益

IZA劳动世界项目致力于IZA研究诚信指导原则．作者声明他遵守了这些原则。

证据地图

评估公共服务的效率

评估公共服务的效率

公共服务效率的差异可以为良好做法提供线索

电梯游说

重要发现

优点

缺点

作者的主要信息

动机