依赖计数数据模型

定量政策评价可受益于分析统计数据的一套丰富的计量经济学方法

瑞士苏黎世大学和德国IZA

单页 全文

电梯游说

通常情况下,经济政策的目的是为了衡量结果。使用基本计数尺度的经济变量的例子有:作为生育指标的子女数量、作为保健需求指标的看医生次数、作为员工偷懒指标的旷工天数。有几种计量经济学方法可用于分析这些数据,包括泊松模型和负二项式模型。它们可以提供从标准线性回归模型中无法获得的有用见解。通过两个实证例子说明了估计和解释。

计数模型可以用来预测劳动力流动

重要发现

优点

计数数据回归为非负整数0,1,2等提供了适当、丰富且灵活的建模环境。

泊松回归是估算恒定相对政策效应的主力模型。

障碍和相关模型允许区分广泛边际效应(结果为零的概率)和密集边际效应(一次或多次计数的概率)。

有了统计数据,政策评估可以超越对平均效应的考虑,而是确定对整个结果分布的影响。

缺点

计数数据模型施加参数假设,如果无效,可能导致不正确的策略结论。

虽然许多软件包实现了标准计数模型,如泊松模型和负二项式模型,但更精细的模型可能需要研究人员进行一些编程。

计数数据方法并不能解决基本的评估问题:在缺乏随机对照实验的情况下,从观察数据中确定政策效果可能会受到选择偏差的影响,这需要以准自然实验的形式出现貌似合理的外生变化。

作者的主要信息

实证分析经常会遇到0、1、2等尺度的变量,比如一个人的工作小时数或每年看医生的次数。政策制定者可能感兴趣的是改革对这些结果的分配效应,而不仅仅是平均效应。例如,策略对服务重度用户的影响是否大于偶尔用户?泊松模型和负二项式模型及其扩展可以回答这个问题,它们并不比线性回归模型复杂。障碍模型对于预测一项政策对零计数概率的影响是有用的,而不是一个或多个计数。

动机

计数数据模型允许当感兴趣的因变量是数值计数时进行回归类型分析。它们可以用来估计政策干预对平均利率或对无事件、单个事件或多个事件发生概率的影响。例如,可以从治疗单位和非治疗单位的比较中确定效果,同时调整混淆变量,或者从差异中的差异比较中确定效果,其中政策的效果是通过比较治疗组的结果分布的post前变化与对照组的post前变化得出的。

从泊松回归模型中获得结果并不比运行线性回归模型复杂,对结果的解释也同样简单。的确,虽然泊松模型将平均值表示为解释变量的指数函数,因此是一个非线性模型,但它保留了线性回归模型的许多特征。实际上,它是广义线性模型的一种[1]

正反两面的讨论

比较线性模型和计数数据模型

在线性模型中,因变量的范围通常是实数的集合;在计数数据模型中,它是包含0的自然数的集合。在线性回归模型中,斜率系数表示预期结果的绝对变化与时间的单位变化相关x(例如,fromx0= 0到x1= 1),而在具有指数条件平均函数的计数回归模型中,系数给出了与的单位变化相关的预期结果的相对变化x.在这两种情况下,一致的参数估计仅依赖于一个正确指定的平均函数。

虽然线性模型的普通最小二乘估计的鲁棒性和通用性很好理解,但可能不太为人所知的是,非线性泊松最大似然估计作为伪最大似然估计的一个实例,具有类似的性质[2].这种稳健性具有很大的实际意义,因为它意味着即使分布假设不正确,泊松回归模型中参数的估计量也是一致的,而这种情况经常被证明是错误的。

泊松回归也可以应用,即使因变量根本不是一个计数,而是一些连续的非负变量,如持续时间、工资或价格。一个例子是应用泊松模型来估计国际贸易的引力方程[3].当在这种情况下使用泊松回归时(假设平均值被正确指定,但分布可能是错误的),一个重要的警告是,通常的标准误差公式是错误的。在许多情况下,标准误差会低估估计器的真实可变性,从而导致置信区间过小和膨胀t统计数据。然而,一种简单的调整方法是可行的,它会导致所谓的“稳健”标准误差,这应该定期报告。

为什么使用计数数据模型?

计数数据模型在政策评估中有两个主要用途。通常,重点是确定政策更改对平均计数的影响。其他应用程序利用计数数据模型产生整个概率分布的预测这一事实。因此,在策略上下文中,可以确定策略对结果的每个值的效果。

图1在一个假设的例子中使用泊松模型说明了这种情况。它显示了在没有政策和有政策时,结果0、1、2等的预测概率。在本例中,结果是一个季度内的医生就诊次数(作为卫生服务需求的指标),政策措施是取消所有共同支付和免赔额,即全额保险。

策略对计数分布的影响

的计算图1假设没有该政策的平均访问量为1.65,有该政策的平均访问量为2.0。因此,该政策与平均结果增加约2.0/1.65 - 1 = 21%相关。另一方面,该政策也与零使用概率下降5.8个百分点有关。对于泊松模型,零的概率简单地计算为负平均值的指数,在没有策略的情况下为0.192,在有策略的情况下为0.135。类似地,泊松概率函数可以用来表示1的概率降低了5个百分点,而4的概率增加了4个百分点。

如果政策制定者不仅对一项政策的平均效果感兴趣,而且对其分配后果也感兴趣,这可能是非常有用的信息。然而,结果与参数分布模型的基本假设密切相关——在这种情况下,泊松分布——而这种分析的合理性因此关键取决于这个基本假设的有效性。下面将讨论测试和替代规范。

研究人员有时会在成熟的分布分析和仅通过区分广泛和密集边际效应来考虑平均效应之间选择一种妥协。广泛边际效应是指一项政策对零使用(不使用)概率的影响,而密集边际效应是指一项政策对平均值的影响,条件是计数为正。一个典型的例子是工资税变化对劳动力参与决策的影响和对工人决定工作多少小时的影响之间的区别。对于任何计数数据模型,广泛和密集边际效应都可以很容易地得到。在这个上下文中特别有趣的是障碍模型,它将零计数的过程与非零计数的过程区别对待。在许多应用程序中,添加这种额外的灵活性非常重要。

哪种计数数据模型?

对于指数回归模型的鲁棒估计之外的所有目的,计数数据方法迫使研究人员致力于特定的参数分布。明智的选择应该基于底层数据生成过程的假定属性。例如,如果事件以常数概率完全随机地随时间发生,泊松模型是合适的。这种潜在的随机性可以是一个合理的假设,例如在交通事故频率的情况下。在其他情况下就不那么令人满意了,比如员工缺勤,众所周知,缺勤更有可能发生在一周的某一天[4]

缺勤的例子可能受到了与泊松假设进一步背离的两个方面的影响。首先,对于今天缺勤的工人来说,明天缺勤的可能性更高。这是“发生依赖”的一个实例。其次,员工的内在缺勤率可能有所不同,有些员工比其他人更有可能缺勤一天。这可能取决于责任心等软人格因素,但也取决于家庭情况,例如,如果工人家里有年幼的孩子。如果没有观察到,这些影响就会导致所谓的“未观察到的异质性”。发生依赖性和未观察到的异质性都使泊松模型下的假设失效。未观察到的异质性导致“过度分散”:在条件模型中y作为函数x时,方差随均值成不成比例地增加。

虽然出现依赖的问题不容易解决,但每当对同一单元或面板数据进行重复观测时,就会出现一种解决未观察到的异质性的强大方法。例如,如果有关于一名工人几年来每年缺勤次数的数据,可以通过包括个别特定的固定影响,直接模拟缺勤倾向的个别差异。面板泊松回归模型易于实现,并具有许多已知的线性面板数据模型的特征[5]

可以在特定的假设下推导出替代模型。例如,一个负二项式模型可以被证明是由于未观察到的异质性或发生依赖性而产生的。如果数据过于分散,该模型可以更好地预测结果概率。特别是,它比具有相同均值的泊松模型预测了更高比例的零。如果一个事件发生的概率随着时间的推移而增加或减少,γ计数模型可能是合适的[6]

障碍模型结合了一个二元概率模型,该模型确定结果是零还是严格的正,并对正条件分布进行参数化说明[7].使用最大似然进行估计分为两个步骤,首先使用二元响应模型的所有观测值,然后使用正观测值的子集来估计零计数截断数据模型。障碍模型可以解释任何程度的“多余零”,并且进一步允许对广泛和密集边际效应进行不受限制的估计。

在应用卫生经济学中,经常使用一类具有类似性质的相关模型。零膨胀计数数据模型假设数据来自两个不同的群体:一个从未经历过事件的群体,另一个从标准模型生成事件的群体。在这样的模型中有两种类型的零,一种来自“从不”总体,另一种来自“标准”总体[7]

非随机抽样是应用工作中出现的另一个问题。在这种情况下,未经调整的最大似然估计可能导致错误的推断。例子包括截断(当零计数的观察结果不包括在样本中)、审查(当要求儿童数量的调查使用“四个或更多”等回答类别或报告45岁以下妇女的“总”儿童数量时,她们可能会有更多的孩子),以及基于内生选择的抽样(当有大量事件的人在样本中占比过高时)。[8].由于计数数据模型完全指定总体分布,为了获得总体参数的一致估计,处理这种偏离随机抽样的情况变得相当简单。

例子:在生育研究中的应用

统计数据模型的一个自然应用是在生育能力的分析中,这是通过一个妇女所生孩子的数量或一个家庭中活着的孩子的数量来衡量的。模拟生育遇到了许多有趣的方法挑战。在没有特定的顺序,这些包括经常存在的分散不足(见[6]),不孕不育而不是个人选择对不生育的影响,并解释了接受调查的妇女可能尚未达到完全(全部)生育能力的事实。

处理不完全生育的最激进的方法将年轻女性排除在分析之外,比如45岁或更年轻的女性。不过,这种方法有几个缺点。首先,由于缺少关于当前生育一代的数据,导致在收集关于生育模式的证据方面大大滞后。如果生育行为在队列中迅速变化,这种滞后就会成为一个更大的问题。其次,如果儿童的数量是基于家庭组成数据,这种方法就不能使用,因为儿童通常一到成年就离开家庭。因此,把所有妇女包括在内是有利的,但把年轻妇女的子女数量作为完全生育能力的下限。在参数计数数据模型的背景下,建立相应的截尾概率模型相对简单。参数模型也可以修改,以考虑文化决定的对两个孩子的偏好,导致在许多数据集中观察到“两个膨胀”。

例子是图2显示了德国和美国这两个国家过去40年的总生育率,以及经合组织国家的平均生育率。总生育率是通过将某一年观察到的特定年龄的生育率相加来计算的,以得到一个假设女性一生的生育率等于该年不同年龄女性的实际生育率的孩子数量。1970年至2010年期间,德国的生育率显著下降,从每名妇女2.03个孩子下降到1.39个孩子,经合组织的平均水平从2.76个孩子下降到1.74个孩子;在美国,生育率在1980年之后稳定在更替水平附近。

德国和美国1970-2010年总生育率趋势

显然,政策制定者对这种下降的原因很感兴趣,已经进行了许多研究,以梳理劳动力市场发展的相对贡献,更长的教育周期(因此更高的第一次生育年龄),仅举几例。使用1974 - 2002年美国综合社会调查的完整生育率数据进行的说明性分析显示了在这种情况下如何使用计数数据模型。根据对5150名超过育龄妇女的观察,平均子女数量为2.59人,14.5%的妇女没有子女,子女的模态数量(出现最频繁的数量)为2人(占所有妇女的26.6%)。一个简单的泊松回归只包括线性时间趋势给出系数为-0.01。由[9]产生了一些过度分散的证据。因此,应该使用鲁棒标准误差。在这种情况下,这种趋势在统计上是非常显著的,根据模型,在此期间,儿童的平均数量每年下降约1%。

需要考虑的一个问题是不断变化的社会人口状况对这一长期趋势的贡献。在控制了受教育年限和种族(白人= 1)、低收入(16岁时家庭收入低于平均水平= 1)、16岁时生活在城市和移民身份等指标后,对趋势成分的新估计是生育率每年下降0.55%,在这种情况下,是不考虑教育、种族、收入、城市居住和移民身份的55%。另外45%的下降可以用这些因素来解释。在广义范围内,泊松模型预测,在26年的时间里,没有孩子的母亲在其他方面的特征没有变化的可能性增加了2.9个百分点。

相反,估计线性回归模型得出的预测绝对效应是生育率每年下降-0.014,相当于每70年少生一个孩子。与泊松模型相比,线性模型意味着不同的相对影响,因为对于给定的绝对变化,预测平均值越大,相对变化越小。对隐含的相对效应进行样本平均,估计每年儿童数量下降0.58%。在这个例子中,线性回归模型隐含的平均相对效应与泊松模型估计的效应相似,但这并不需要在一般情况下成立。请注意,从业人员想要估计一个恒定的相对效应模型,通常使用线性回归模型后,已转换因变量取对数。这在这里是不可能的,因为相当一部分数据的结果变量为零。

示例:健康服务需求的应用程序

德国的医疗保健系统,像大多数其他国家一样,在最近几十年经历了许多政策变化。这些例子包括医生的开支上限、医院私有化、在医院报销中引入与诊断有关的小组,以及为用户提供新的费用分担安排。大约90%的德国人口通过德国法定健康保险制度获得健康保险。使用计数数据模型进行分析的改革包括1997年的改革,增加了处方药的共同支付,以及2004年的改革,引入了医生看病的共同支付。这两项改革都宣称目标是通过减少不必要的医疗需求来控制保健支出的增长速度。

1997年的改革将处方药的自付费用提高了一个固定的数额。1997年改革的相对效果对小包装最大,增加了200%。社会因素导致了一些豁免(对于共同参保的儿童和低收入家庭,最高累计年共同支付限额为年总收入的2%,慢性病患者为1%),从而在私人参保者之外产生了潜在的对照组。

评估此类改革有效性的一种方法是根据家庭调查数据(如德国社会经济小组)推断出行为中的政策反应。虽然这类调查并非专门为提供与健康有关的信息,但通常有一些关于健康保险状况(私人或法定)和医疗保健使用情况的有限信息(例如年度访谈前三个月的住院人数和看医生人数)。对于1997年的改革,人们最好研究处方药需求的变化,但调查数据中没有这方面的信息。然而,由于处方需要看医生,分析可以集中在可能减少看医生所带来的间接成本节约效应上[9]

由于就诊人数是一种计数,对这些改革对卫生服务需求影响的定量评估可以采用计数数据模型,使用改革前和改革后的比较或差异中的差异分析[9][10].例如,为了分析1997年改革的效果,可以使用德国社会经济小组两年的微观数据,1996年的数据为改革前时期,1998年的数据为改革后时期。有法定健康保险的受访者可被视为治疗组,有私人保险的受访者可被视为对照组。对照组在改革前后的医生就诊中建立了一个与事实相反的基准趋势,例如,由于总体经济状况的变化。治疗组观察到的任何偏离基线趋势的情况都被认为反映了改革的效果。

对于这些医疗改革,就像其他改革一样,我们有充分的理由相信,并不是每个受影响的人对改革的反应都是一样的。特别是,广泛和密集边际效应可能有所不同——在这种情况下,对任何访问的影响与对非零访问次数的影响相比。在1997年改革的案例中,与健康状况良好的人相比,慢性病患者为了避免共同支付而做出反应的余地可能更小。因此,在结果分布右侧的密集边缘,人们对改革的敏感性会低于粗放边缘。

为了解决这个问题,一项研究估计了各种计数数据模型,并确实发现了差异响应的证据[10].基于障碍模型,1996年至1998年间,成为处方药使用者(至少看一次医生)的预测概率估计下降了6.7%,而以使用为条件的预期看医生次数估计只下降了2.6%。相比之下,一个没有障碍的简单泊松模型会导致截然不同的效应估计,在广泛边际上下降3.0%(而在障碍模型中下降6.7%),在密集边际上下降6.1%。这说明了标准泊松模型的巨大偏差,并强调了对具有足够灵活性的模型的需求。

局限性和差距

关于政策效果的结论的可靠性取决于支持计数数据建模的假设的有效性。中讨论了几种规格测试[9],例如,针对方差和均值相等的泊松假设,反对过度分散的替代方案。在实践中,很难为任何计数数据模型辩护说它完全正确。相反,这样的模型应该被视为真理的近似值,结果是近似的效果。对于统计推断,报告稳健的标准误差总是很好的做法。

与线性回归模型类似,在计数数据模型中识别和估计政策效果需要外生的,或者“好像是随机分配的”政策变化。例如,如果参与者以非随机的方式自我选择进入政策“治疗”组,则违反了这一要求。有时,这个问题可以通过使用多元回归来解决,并在计数模型中包括所有可能决定一个人是否得到“治疗”并因此受到政策干预影响的变量。如果有关于影响治疗但不影响结果本身的变量的信息,则可以通过在模型中包括治疗变量的预测水平而不是实际水平来解决问题。这种方法功能强大,常用于线性模型。它有时也适用于计数数据模型,但这些应用程序是例外[11]

在建模时间序列计数时出现了进一步的限制。为了说明这个问题,考虑一下主要的线性一阶自相关过程。如果现值是上一个周期的值加上一个随机误差的分数,它将不是一个非负整数,或计数,即使最后一个周期的值和误差是。虽然一些时间序列模型可以为数据的非负整数结构生成条件分布和边际分布,但这些模型往往是笨拙的。目前还没有与我们对线性高斯时间序列模型以及如何处理非平稳性和协整等问题的理解相对应的方法。对于面板数据,泊松模型有完善的和易于估计的随机和固定效应扩展,但其他模型,包括这里讨论的障碍模型,通常没有。

摘要和政策建议

常言道:“不是所有可以计算的东西都有价值。”没错,但通常情况下确实如此。孩子的数量、因缺勤而损失的工作日数量或看医生的次数都是重要的社会结果。犯罪是另一个主要的公共政策问题,统计数据模型已被用于表明死刑对谋杀率没有短期威慑作用[12]而包括谋杀在内的严重犯罪似乎并不具有“传染性”[13]

政策制定者往往对改革对统计结果的分配影响感兴趣。例如,一项政策对医疗保健服务的重度使用者与偶尔使用者的影响是否不成比例?对于连续的结果,这样的研究问题通常会使用分位数回归来解决。通过计数,这种不对称响应可以直接建模。由于对泊松模型的假设有信心,这些效应依赖于一个参数,如中所述图1.简单的偏离,如零膨胀模型、障碍模型、双膨胀模型和有限混合模型,允许在不同结果值下产生更灵活的影响,同时保持“理论一致”,从某种意义上说,这些模型可以生成数据,并且派生自定义良好的底层数据生成过程。诚然,这些模型大多是在20世纪80年代和90年代开发的,它们还没有作为实证方法的标准课程的一部分来教授,但它们在应用经济学研究中的应用已变得越来越普遍。随着决策者越来越意识到计数数据模型的好处,这种模型也可能在政策研究中变得越来越普遍。

致谢

作者感谢一位匿名的推荐人和IZA劳动世界的编辑们为早期的草稿提供了许多有用的建议。作者以前的作品包含了本文所介绍材料的大量背景参考资料,并在本文的所有主要部分中被大量使用[6][10]

相互竞争的利益

IZA劳动世界项目致力于IZA研究诚信指导原则.作者声明他遵守了这些原则。

©Rainer Winkelmann

证据地图

依赖计数数据模型

完整的引用

完整的引用

数据源(年代)

数据类型(年代)

方法(年代)

国家