最大似然和经济建模

极大似然是劳动经济学中估计模型参数的一种通用而灵活的方法

瑞典尤梅夫大学

单页 全文

电梯游说

经济学家可以获得的大多数数据都是观察到的,而不是自然或准实验的结果。这使分析变得复杂,因为观察上不同的个体对给定环境表现出相似的反应,而观察上相同的个体对类似的激励表现出不同的反应是很常见的。在这种情况下,使用最大似然方法来拟合经济模型可以提供一种描述观察到的数据的一般方法,无论其性质如何。从拟合模型中获得的预测提供了有关经济政策分配结果的关键信息。

在提供的工资(w)下,个人选择工作时间(h)的观察和预测分布

重要发现

优点

最大似然方法能够测量复杂经济模型的参数,即使存在复杂的抽样方案。

最大似然可用于分析任何类型的数据,无论是观测数据、实验数据还是准实验数据。

通过使用样本中可用的所有信息,最大似然方法产生给定特定模型的“尽可能好”的测量结果。

最大似然方法允许对描述给定模型的所有可检验的假设进行检验。

缺点

最大似然方法需要一个经济模型的规范,该模型适当地描述了在样本中观察到的事件的概率分布。

使用最大似然需要对模型中未观察到的组成部分的分布进行假设。

如果建模假设不满足,估计将遭受偏差,影响鲁棒性。

最大似然方法依靠数值方法来评估和最大化似然。

作者主要信息

最大似然是在数据不适合使用统计技术的情况下估计参数的统计方法,这些统计技术通常应用于来自同质群体的实验研究的数据(如差中差分析)。一个详细说明的经济模型是一个有用的工具,可以用来理解政策变化的后果,这些变化不一定是边际的,也不一定会影响结果的分布和平均结果。该模型及其估计对于模拟不同环境或不同情景下政策的分配效应是有用的。

动机

最近在劳动经济学中的许多实证研究都集中在使用现场、自然、准或故意的实验简化型框架识别和衡量经济激励的因果影响。这可能表明,进一步开发类似的方法将会取得进展[1].不幸的是,对于大多数经验主义劳动经济学家来说,证据很少是这种典型的:数据可能经常是观察性的,而不是实验性的,而且可能很少(如果有的话)可以利用的准实验性特征。此外,很可能没有明显的或令人信服的辅助变量可用。

因此,大多数经验主义经济学家只能做出令人不快的选择:要么忽略“错误类型”的数据(观察数据),要么试图将数据改写为可接受的类型,比如通过寻找一个自然实验来加以利用。虽然尝试重铸数据可能偶尔会成功,但这种方法并不总是可行的。此外,在许多情况下,设计经济政策需要衡量超出待遇对被待遇者的平均影响的数量,例如工资或收入弹性。一般来说,平均治疗效果可能是对设计更好的政策至关重要的参数的混合[2][3]

经济学提出了结构模型其中观察到的和未观察到的特征之间的相互作用描述了数据是如何分布的。将结构模型与最大似然估计相结合,可以为观测数据和实验数据的分析提供一种有用的替代途径。

讨论利弊

模型和数据

一个可估计的经济模型对描述环境的变量(外生变量)和描述利益结果的变量(内生变量)之间的关系做出了许多假设。当有很多内生变量时,模型描述了它们之间的关系。最后,该模型描述了来自非受控源的可变性如何决定结果的分布。模型所隐含的结果的精确分布取决于特定参数的未知值。模型假设可用于在给定外生变量和参数值的情况下预测样本中观察结果的分布,这反过来又允许评估数据的可能性。最大似然估计方法的目的是找到最有可能产生观测数据的参数值:即使观测数据的似然值最大化的参数值。

劳动经济学家已经使用最大似然方法来估计参数值,当给定类型的结果的条件分布是众所周知的-离散(二元,有序,多项或计数模型),删去或截断(tobit模型),或选择(罗伊模型及其推广),例如。大多数计量经济学软件提供“随时可用”的估计例程,以获得适合每个特定实例的模型的参数估计。

在少数情况下,数据是通过准实验或自然实验产生的,为了衡量特定结果对给定政策变化的反应,经济模型不必完全制定。然而,这样的测量只有在分析产生数据的实验时,分析人员所考虑的世界中相互竞争的模型的特征时才有意义。

经济分析的力量在于它能够清楚地说明决定主体行为的因素的假设,给定他们所面临的约束,以及关于允许个体行为相互一致的机制的假设。例如,在最简单和最常见的经济分析中,经济学家描述单一市场的需求曲线和供给曲线,并讨论它们的相互作用如何决定观察到的均衡数量和价格。

当分析师能够区分需求价格弹性(响应1%价格变化的需求量相对变化的比率)和供给价格弹性(响应1%价格变化的供应量相对变化的比率)时,这种类型的模型在实践中是有用的。然而,这并不总是可能的,因为现有的证据(均衡价格和数量)是供需双方未观察到的相互作用的结果。有两种策略可以使使用观察数据来区分供给方和需求方的行为成为可能:排除限制,它假设了每一方特定的外生变化来源,以及对需求或供应时间表形状的限制,因此需求数量是价格的递减函数,而供给量是价格的递增函数[4].虽然一种假设似乎比另一种更合适,但要确定从数据中可以学到什么,就需要发展出定义要测量的关键参数的假设。

更丰富的数据需要表示可以观察到的主要特征的建模策略。特别是,异质性是劳动经济学家使用的数据的一个重要特征。在许多研究中,在其他方面相似的观察中,未观察到/无法解释的变异性很可能占观察到的变异性的一半以上。人类行为产生的数据具有如此多的异质性,而这些异质性与观察到的特征并不密切相关:即使在同质的人群中,潜在的可变性也是很大的[5].假设是,行为反应的决定因素与经济激励和个体异质性之间的相互作用解释了观察到的数据特征。模型参数的测量可能不适合传统的线性回归,但可能需要依赖于数据分布特征的方法,如最大似然方法。

一个说明性例子

示例可以使您更容易地理解建模、估计和解释的过程。考虑单个工人的劳动力供给模型[6].如果提供的工资足够高,工人将提供劳动力;否则,他们就不会参与劳动力市场。如果该工人为其提供劳动,则可以观察其每小时工资和每个周期的工作时间。如果他们不提供任何劳动力,就没有关于他们可能得到的工资的可观察数据。因此,个人行为产生了复杂的数据。

现在考虑一个由相同个体工人组成的随机样本的假想分布,假设(为了简化)提供三种不同的工资水平,并且有三个正的工作时间水平(参见插图).非参与者的工作时间为零,并且没有工资记录(因为由于工作邀请被拒绝,观察者不会知道提供的工资)。

接下来,对观察到的分布拟合一个简单的劳动力供给模型。该模型假设每个人都收到一份工资(三种潜在工资中的一种),然后决定工作的小时数。人们在选择自己喜欢的选项时,会权衡每个可选择的工作时间,消费收入带来的乐趣与工作的负效用。消费的效用随着消费的增加而增加,而工作的边际负效用则随着工作时间的增加而增加。此外,还有一些未被观察到的因素将随机性引入到个体决策中:在观察上相同的个体(在这个例子中,可以想象人群中的所有个体都具有相同的年龄、教育程度和婚姻状况)仍然可以表现出不同的最佳选择(因为个人特征是不可观察到的,比如个人不喜欢工作)。因此,观察到的结果差异是个体之间未观察到的差异的结果。该模型依赖于三个参数,这些参数衡量了消费和工作之间的权衡,以及个人选择分配中未观察到的组成部分的重要性。

最后,假设提供给定工资的概率是每个工资水平的单个参数,并且产生工资提供的过程和产生个人工作品味差异的过程是独立的(这意味着对提供的工资的观察不包含任何关于决定个人工作选择的未观察因素的信息)。因此,两个独立的概率参数表征了工资的分布。

观察到的样本的可能性是所有观察到的工作时间和工资的概率的乘积。对于非参与者,工资缺失并且观察到零工时。似然的对数简化了对产生最大样本似然的参数值的分析和搜索。在这个例子中,它是不工作概率的对数的加权和,以及每个可能的工作时间水平和所有可能的工资的正工作时间概率的求和对数的加权和。

需要计算和编码这样的表达式是最大似然方法的一个明显缺点:在复杂的情况下,确定对数似然是否被正确编码是困难和耗时的。在当前的简单情况下,使用传统的数值方法可以很容易地最大化日志的似是而非(商业统计软件和免费的开源数学软件,如R或SageMath都提供了优化器)。的插图显示结果的观测分布和使用最大似然法对模型的五个参数的预测分布。预测的分布与观测到的分布相似,但不完全相同。

偏好模型将产生一个采用简单(对数)线性形式的劳动供给函数,这样,工作时间的对数与工资率的对数线性相关。如果忽略零工时的观察结果,则工资弹性可以通过仅对正工时(和正工资)进行简单回归来估计。最大似然估计给出的隐含弹性为2.63,而回归方法给出的估计约为0.66。两种估计之间的差异表明,参数估计对模型的精确规格和样本组成很敏感。由于工资报价分布和未观察到的味道成分的分布是独立的,因此两种估计之间的差异是由于样本选择(从非参与个体的观察值的回归估计样本中排除)以及观察到的小时数不是根据劳动供给函数确定的。

对数似然的形状描述了参数估计的精确程度。图1显示对数似然如何随着隐含工资弹性值的变化而变化,同时保持所有其他参数的估计值不变。隐含工资弹性小于2.5和大于2.85的值没有数据证据支持。此外,应用于正小时数据的简单(普通最小二乘)估计得到的0.66值与基于考虑所有观测值的模型的最大似然估计相距甚远。

对数似然随隐含工资弹性值的变化而变化

模型和政策评估

经济模型和似然方法可以一起用于评价研究。假设一位政策制定者想要了解劳动力供给对引入最低工资的反应。最低工资在第一阶段和第二阶段都不适用,在第二阶段只适用于第二阶段。为简化,假设观察到四个独立的随机样本,每个区域和时间段各一个样本,如上半部所示图2.在引入最低工资后的第二个区域和第二个时期,随机样本在劳动力供应和工资方面的分布如图右下角所示(第二时期的区域2)。表中的每个单元格都报告了给定工时数和工资率下的观察次数。非劳动力市场参与者(h= 0)不报告他们的工资,因此参与者的数量对应于h= 0,而不是特定的工资率。

最低工资前后劳动力供给与工资分布的观察与预测(= 3)

该模型假设工作时间和消费之间的偏好不受最低工资的影响;因此,所有地区和时期的偏好都是共同的。此外,有最低工资的地区(2)的工资供给分布与没有最低工资的地区(1)的工资供给分布是独立参数化的。这就解释了为什么在地区2引入最低工资之前和之后,地区1的预测值是相同的。相对于基于中所述数据的估计插图,行为参数基本不变,而隐含劳动供给弹性略大,为2.7。

中报告的观测分布的证据图2表明最低工资的引入对供给时间的分配产生了相当大的影响,特别是通过减少区域2的不参与:只有8人没有工作(h= 0),而第1时期有20人。这些分布变化可能不会实质性地影响平均值,因此可能无法通过差异中的差异(DiD)方法捕捉到,这种方法比较了在有最低工资和没有最低工资的情况下,结果随时间的平均变化,这种方法试图模拟实验条件[7].但是,分布的变化被拟合的经济模型捕捉到了,如下图所示图2估计模型预测,没有工作的人数将从17人(没有最低工资)减少到8.2人(引入最低工资后)。

模型所隐含的预测分布可以用来计算最低工资的影响,正如DiD方法所测量的那样。重现要求较低的DiD分析结果的能力提供了对模型和使用最大似然方法获得的参数估计的稳健性的检验。有或没有最低工资的平均工作时间(或平均正工作时间或工资)的差异可以从指定的模型中预测。这些预测的差异是描述行为反应的参数和描述有最低工资和没有最低工资的工资提供的参数的复杂混合物。

用于衡量引入最低工资对供应时数或支付工资的影响的DiD分析未能检测到对工作时数、对数时数或工资(当关注的是正工作时数时)的任何统计上显着的(加性)影响,但它确实发现了对平均对数工资的显着(比例)影响(增加约12%;图3).报告中的预测图3从拟合模型和从DiD分析的点估计是非常一致的,这支持了经济模型的规范。

模型预测差异与估计差异无差异(DiD)的比较

限制和差距

上面讨论的模型示例中适合因为数据结构相对简单的数据(在最简单的情况下,模型需要预测的概率只有十细胞的可能性,不占引入最低工资可能会减少工作机会的数量收到),因为该模型取决于一个足够大的数量的参数在该最初病例和六(5占最低工资的影响)。在更现实和复杂的情况下,要理解模型应该包含的特征,以便提供数据和生成它们的机制的忠实表示,将会更加困难。规范搜索将包括搜索行为反应的更灵活的表示,以及搜索模型试图表示的个体代理之间未观察到的可变性的简洁描述。这种搜索通常很难成功进行。

当使用基于可能性的方法时,更复杂的模型会带来更多的困难。确定或评估可能性可能是困难的,并且在寻求找到可能性的最大值时可能会出现数值问题。这样的数值问题可能需要大量的努力来解决。通常选择是在一个更简单的模型和一个更复杂的模型之间进行选择,前者很容易获得似然估计,而后者的估计更难以表征或更耗时。

模型的说明和基于似然的估计方法的使用不足以解决劳动经济学中困扰大多数实证应用的常见识别问题。研究人员仍然需要提供仔细的论据,支持或反对在他们的模型中存在一个给定的解释变量。

摘要及政策建议

使用经济模型和使用最大似然估计其参数对劳动经济学家来说是有价值的工具。这种方法允许对来自大多数来源的数据进行分析,并且可以深入了解通常摘要(回归中的参数估计)的决定因素,而要求较低的方法(如DiD)将获得这些决定因素。

根据本文中提供的例子,该模型可以,例如,用于计算预测的人口分布,假设工资分布非常不同,或评估引入最低工资或所得税制度的影响,假设估计的偏好保持不变。这种方法对更广泛的前瞻性政策分析是有用的。最近对文献的贡献提供了更多的例子和可能性和困难的讨论[8][9][10][11][12]

最后,该模型和估计有助于建模和理解政策在不同环境或不同情景下的分配效应。对数似然分析的图解图1建议这样的模拟练习应该在几个几乎同样可能的模型参数的备选值上进行。现代信息技术和计算机能力使得模型的分析比这里介绍的模型要复杂得多,也有价值得多。总之,使用模型加最大似然的方法学方法允许对更一般的数据类别(观测和实验)进行分析,并对给定参数估计的政策设计进行更深入的分析。

致谢

作者感谢匿名审稿人和IZA劳动世界编辑对早期草稿的许多有益建议。支持本文的分析细节和计算可以在作者的个人网页上找到:

相互竞争的利益

IZA劳动世界项目致力于IZA研究诚信指导原则.作者宣称已遵守这些原则。

©Gauthier Lanot

证据地图

最大似然和经济建模

完整的引用

完整的引用

数据源(年代)

数据类型(年代)

方法(年代)

国家