重力模型:迁移分析的工具

关于移徙流动的双边数据的可用性重新引起人们对利用重力模型确定移徙决定因素的兴趣

西班牙巴塞罗那大学和德国IZA大学

单页 全文

电梯游说

长期以来,重力模型在分析与商品和服务、资本甚至人员的运动有关的经济现象方面一直很受欢迎;然而,关于移徙流动的数据限制阻碍了它们在这方面的使用。有了改进的双边(国与国)数据,研究人员现在可以使用引力模型来更好地评估移民政策的影响,例如,签证限制政策对移民流动的影响。在不同的背景下说明了重力模型的规范、估计和解释,并描述了当前实践的局限性,以使决策者能够做出更明智的决策。

重力模型已被学术界和政策顾问广泛使用

重要发现

优点

引力模型提供了一个直观的框架来理解国家间流动的决定因素,特别是贸易、移民或资本。

重力模型很容易从随机效用最大化模型等理论模型中推导出来。

有多种方法可以解释与重力模型相关的分析挑战,例如使用仪器变量或固定效应。

经验模型可以很容易地扩展,以考虑不同的附加控制和政策变量。

缺点

重力模型的估计需要国家对的详细数据(即关于两个国家之间有直接流动的具体国家的数据),这并不总是容易获得的。

重力模型在使用包含负值或零值的数据集时会遇到困难;一些解决方案正在研究中,但挑战依然存在。

由于有关数据完整性和其他影响因素的问题,从政策角度解释引力模型结果并不总是直截了当的。

作者主要信息

重力模型假设两个国家之间的流量与它们的大小(人口或GDP)成正比,与它们之间的物理距离成反比(类似于牛顿的引力定律)。由于最近有了双边(即双向、国与国之间)移徙数据,重力模型在移徙流动方面的使用越来越频繁。这有助于在评估政策影响时更好地了解移民决定因素。新数据集应用的进一步改进将增强重力模型在移民政策背景下的有用性。

动机

最简单的引力模型将双边移徙与原籍国和目的地国的相对大小以及它们之间的距离联系起来;然而,还有其他因素可以影响迁移流。因此,在重力模型中增加了与不同迁移拉、推因子相关的变量;例如,目的国有更好的经济机会(即更高工资或更低失业率的前景)、更安全的条件和更高的政治自由等等。

重力模型已被用于了解距离或语言接近等外生因素的作用,同时也被用于评估签证限制等政策影响。事实上,在过去几十年中,重力模型的使用一直在广泛增长,尽管在数据可用性和其他技术问题方面仍然存在一些限制。

讨论利弊

迁移重力模型的微观基础

重力迁移模型的理论基础通常由随机效用最大化(RUM)模型表示(见[1][2],[3]等等)。RUM模型描述了个人从生活在一个特定国家获得的效用,与移居到其他目的地时获得的预期效用进行了比较。这种比较既包括预期收益(即增加目的地吸引力的因素,如更高的预期收入),也包括从原籍国迁移到目的地的成本(如距离或不利的移民政策)。

RUM模型还包括一个组件,该组件捕获与每个选择相关的单个实用程序的未观察到的因素。研究人员对这一组成部分的统计不确定性的假设决定了个体通过选择特定目的地来最大化其效用的预期概率。例如,可以采用对数正态分布,即从一个国家到任何其他国家的预期总移民流量取决于原籍国的特征、目的地的吸引力以及目的地国对潜在移民的可及性,这些标准显然类似于重力模型[1]。RUM模型的一个相关假设是,目的地的吸引力不应该受到迁移的影响。例如,如果某一特定目的地由于其失业率低于某一特定原籍国而具有吸引力,那么大量移民的流入可能会增加目的地的失业率,同时减少原籍国的失业率。引力模型没有捕捉到这些第二轮效应,这是一个重要的考虑点,以便适当地解释模型的结果。

无论如何,RUM模型为引力模型背后的直觉提供了适当的理论依据。RUM模型的使用清楚地表明,研究人员所做的假设是什么,以及这些假设如何产生不同规格的经验重力模型。

测量问题(一):出生国、国籍或居住国?

由于可用数据集的一些特定限制(参见迁移的重力模型:可用的数据集),在应用重力模型时,充分了解在分析过程中使用的输入数据的类型和影响是很重要的。例如,根据我们如何考虑他/她的来源,可以根据不同的定义来定义国际移民。劳动力市场分析通常根据移民的出生国来定义移民,因为获得东道国的国籍是所研究的同化过程的一部分。然而,大多数关注移民流动的研究更关注移民的最后居住地,而不是他们的出生国或国籍。话虽如此,关于考虑哪个原产国的决定通常是根据数据的可用性做出的。在这里,重要的是要认识到,将包括在引力模型中的一些移民决定因素将根据公认的国际移民定义而有所不同。例如,签证限制是基于公民身份而不是居住地,而语言邻近性与出生国的关系要比与居住国的关系密切得多。

计量问题(II):双边总流量、净流量、存量还是存量变化?

在存在移民成本的情况下,移居到一个特定国家的决定和留在那个国家的决定是不一样的。因此,对移徙决定因素的分析应基于原籍地数据(也称为二元数据),特别是双边总流量(从一国向另一国特定方向移动的个人的绝对值)。然而,数据可得性的限制使研究人员遵循其他替代方法(例如,存量、存量变化或净流量,或两个分析国家之间移民和移民之间的绝对差异)。这种方法在使用重力模型时提出了挑战,因为很明显,当用作总流量的代理时,存量的变化会受到测量误差的影响。事实上,种群的变化受到返回移徙或移徙到第三国的影响,因此可能得到负值。下一节将讨论负数据值的影响。

其他使用迁移种群的研究人员将他们的结果解释为长期均衡的代表[1]。他们还认为,由于移民存量数据通常基于国家人口普查,因此它们的质量可能高于报告年度移民流量的来源。主要原因是,人口普查处理的是明确的净永久迁移(移民总数减去特定时期的移民数量),并减少了非法移民的漏报。然而,由于人口普查通常每十年进行一次,因此只能提供中期和长期的有趣见解,这与RUM模型不兼容。

日志和零:评估过程的含义

当研究人员使用自然对数从RUM模型推导重力模型时,出现的一个挑战是如何处理双边移民流动中可能存在的零或负值(在使用净流量的情况下)。对于负值,研究人员通常将其从样本中排除或进行纠正,如[3]。在零的情况下,最常见的策略是省略这些观察值或任意添加一个小的正数(通常是0.5或1),以确保对数的定义良好。但是,通过删除零流动,没有考虑到没有移徙流动的国家的有关资料。添加一个正数也是有问题的,因为所选数字的小变化会导致结果的大变化[4]。由于这些原因,文献正在考虑两种替代程序:首先,使用计数数据模型,如泊松,负二项和零膨胀模型(见[5]查看这些方法的详细描述),其次,应用Heckman的选择模型来校正重力方程中的迁移概率。

但是,在应用这些程序时仍应考虑到一些技术问题。例如,泊松伪极大似然消除了使用自然对数的需要,从而减少了与零和负数据点相关的问题,但往往会过度考虑高值流,而且,估计可能面临向参数最优值收敛的问题。关于赫克曼的程序,主要的困难是找到一个合适的工具,一个变量来解释流动的缺乏,但这与流动的大小无关。例如,在所考虑的国家中是否有外交代表已经被使用,因为这个变量可能影响最初移徙的可能性,但不一定影响流动的规模[6]。例如,在A国在B国没有任何外交代表的情况下,获得签证的费用可能会使B国公民不愿移民到该国。然而,同样的作者表明,他们的结果是一致的,即使他们不考虑任何工具,并使用同一组变量来预测国家之间发生移徙流动的可能性和这些流动的强度。

固定效应:忽略变量偏差和多边移民阻力

重力模型通常会增加与拉和推因素相关的额外变量。然而,遗漏的变量偏差(当错误地遗漏一个或多个相关变量时对估计的负面影响)也存在于本规范中。由于更容易获得双边流动的较长时间序列和面板数据的使用(即在多个时间段内观察同一国家对),研究人员能够包括一组国家假人(取值为0或1的变量,表示是否存在某一特征,这里称为国家固定效应),以控制任何可观察或不可观察的预测因素中各国之间的平均差异。在这种情况下,重力模型通常也被放大,具有时间固定效应,考虑到分析中所考虑的所有国家的共同冲击。

在为迁移分析指定重力模型时,另一个相关的问题是考虑对迁移的多边抵制。这一术语与第三国在确定两个特定国家之间的移徙流动方面的影响有关。例如,如果两个国家迁往火星,尽管它们的相对特征保持不变,但由于目前缺乏替代目的地,它们之间的移民流量显然会增加[7]。因此,不考虑潜在替代目的地的影响可能会使政策分析的结果产生偏差。例如,在目的地国之间存在某种程度的移民政策协调的情况下,控制多边抵制移民的研究往往会发现这些政策的影响比不控制的研究大得多。已经提出了控制多边移民阻力的不同方法。如果数据集具有适当的纵向维度(大量的国家对和时间段),则解决方案涉及应用公共相关效应估计器,该估计器允许引入因变量和自变量的横截面平均值[8]。如果这个选项由于数据限制而不可行,一个可能的解决方案是包含起源年份的假人[2]或者是目的地年份假人[3]

值得一提的是,纳入二元固定效应也有助于缓解其他潜在的负面影响。例如,重力模型隐含地假设成本会根据(log)距离线性增加,尽管这并不总是正确的,因为沿着人们常去的路线走得更远可能比去附近不太受欢迎的目的地更便宜。将二元固定效应纳入重力模型中,只要相对成本等级随着时间的推移保持相似(例如,没有在岛屿和大陆之间建造新桥,这会改变相关的旅行成本),就可以捕捉到这些因素。

结构和政策分析

在迁移的背景下使用重力模型揭示了不同的外生(外部)因素如何影响迁移流动。其中一些因素与原籍国或目的地国的特点有关,例如存在较好的劳动力市场前景或某些一般移民政策,而其他因素则与所考虑的特定国家直接有关,例如是否存在双边移民协定。

与环境因素分析有关的研究提供了第一类的例子,即处理单个国家具体因素的研究。特别是,一项研究的目的是调查自然灾害和气候变化在多大程度上可以解释1960年至2000年之间的国际双边移徙流动[3]。作者的分析面向气候变化的中长期影响;他们没有发现气候因素和国际移徙之间有任何直接关系的证据,尽管随着城市环境变得更有吸引力,自然灾害确实对国内移徙有直接影响。

第二组研究的一个例子是,重力模型被用来评估二元变量对移民流动的影响,其中包括对语言接近性的分析。在一项研究中,作者构建了一个衡量原籍国和目的地国之间语言接近程度的指标;他们发现,即使考虑到文化同质性或地理邻近的影响,语言也会影响移民成本[9]。事实上,就失业率而言,语言接近性对双边移民流动的影响比国家差异的影响要大得多,尽管这种影响低于种族网络或其他传统的拉推因素。

在这方面,重力模型也被用于考虑影响原籍国和目的地国之间移徙流动的政策的影响。其目的是量化特定政策对流动的影响,控制剩余的拉动和推动因素。例如,在纵向数据框架中,可以通过包括一个变量来考虑双边政策的影响(例如,消除两国之间的签证限制),该变量允许通过利用随时间(政策之前和之后)和国家之间(受政策影响和未受政策影响的国家)的变化来识别政策的影响。但是,根据数据可用性和定义策略的方式,这不是一项容易的任务。我们已经确定,控制对移民的多边抵制是很重要的,因为大多数政策不仅对有关两国之间的流动有直接影响,而且还会改变其他目的地的相对吸引力。控制对移徙的多边抵制的方法(例如包括原籍年份假人或目的地年份假人)可能在固定影响和政策变量之间造成识别问题。例如,如果一个国家在考虑的整个时期内采用了特定的移民政策,那么由于包含了政策变量和原籍年固定效应,我们的模型中就会出现多重共线性问题(不同解释变量之间的统计关联),这将很难解开(例如,如果两国之间的移民在签署签证协议后增加,但同时,与目的地国相比,原籍国的经济状况更糟)。一个可能的解决方案是在分析签证政策对解释双边移民流动的影响时,应用约束分析(即为所讨论的变量设置最小值和最大值)[10]。以前的文献没有发现签证政策对移民流动的显著影响。然而,在控制了多边对移民的抵制和计算平均边界之后,签证要求的引入使入境流量减少了40%到47%。该政策还产生了一些以前没有考虑到的间接影响。特别是,一个目的地的签证要求的引入使流向其他国家的流量增加了2.8%至16.9%[10]

在考虑重力模型背景下的政策影响时,另一个警告与潜在的内生性有关(即,受移民影响较大的国家可能决定采取更严格的政策,从而在移民和政策之间产生循环连锁效应)。为了解决这个问题,一种可能性是应用工具变量估计器,尽管很难找到合适的工具。这需要找到与我们想要分析的政策相关的变量,但与此同时,它们不应该与重力模型中的其他回归量相关。因此,使用内部工具(如过去的双边流量)并不总是能解决问题,而识别外部工具总是很困难,除非有一些历史事件可以帮助我们识别工具变量。

例如,最近的一项研究使用重力模型分析了国际学生流动的驱动因素[11]。反向因果关系在解释两个作者规范的回归量的结果时也可能是一个问题。首先,他们考虑了网络的作用,以所考虑时期开始时目的地国家受过教育的移民存量为代表。其理念是,接受高等教育的学生可以从目的国技术移民的支持中受益。然而,如果目的地国家支持来自某些特定原籍国的移民,那么他们也会支持来自这些国家的学生的到来,这是理所当然的。因此,观察到的网络对移民流动的积极影响实际上是学生简单地遵循经济移民的一般模式或受家庭团聚计划影响的结果,这些计划与学生来自同一原籍国。为了理清网络对流动的影响,研究人员使用了以下工具:第二次世界大战后存在的客工计划,吸引经济移民在某些特定行业工作,如煤矿或钢铁厂。这些客工协议导致了目的地国家的重要散居,是移民网络的良好独立预测指标。使用这一工具时的结果仍然支持网络对国际学生流动的积极影响。他们申请文书的第二个变量是注册费。 According to their initial results, there is a positive correlation between higher fees in destination countries and higher flows of international students. Although this unexpected result could be explained as a signal for the presence of higher quality education in the destination country, it could also be related to reverse causality. Those universities that are more attractive for international students can afford to charge them higher fees. As this policy can easily be implemented by private universities, the researchers use the following instrument: the private sector’s share of total expenditures in the higher education systems in destination countries, a variable that is related to the capacity of universities to charge higher fees, but not necessarily explaining international student arrivals. When using this instrument they obtain no significant effect of fees on flows, a result that could also be related to the existence of grants for international students.

值得一提的是,工具变量的使用也可以被证明是一种纠正因遗漏变量而产生的潜在偏差的方法。但是,如果多边对移徙的抵制考虑到固定影响,问题通常就会得到缓解。

限制和差距

在移徙分析的背景下,重力模型的主要限制是双边移徙数据的有限可用性;然而,情况正在迅速改善。目前,主要关注的是诸如多边抵制移徙或频繁出现零观测值等问题。当重点不是国际移徙而是国内移徙时,数据的局限性也更加明显,这是一个日益受到关注的主题,人口普查的微观数据正在成为这种分析的最相关来源。

一些作者还使用重力模型来估计不同国家对之间潜在的未来移民流动。例如,2010年的一项研究指定并估计了一个重力模型,该模型可以作为人口预测模型的一部分[12]。考虑到这一目标,作者选择了可以根据人口情况轻易预测的解释变量。尽管这种分析可以提供一些见解来帮助预测移民流动,但从这个角度使用引力模型在评估不同政策情景的影响方面只会提供有限的效用。特别是,虽然重力模型可用于对政策变化后移民流动的演变进行反事实评估,但反事实评估需要谨慎进行,并且必须适当考虑到多边抵制移民的影响。正如前面提到的,RUM模型的一个相关假设是,目的地的吸引力不应该受到迁移的影响,这在现实中可能并不总是如此。使用重力模型计算迁移潜力的研究人员应该意识到这一局限性。

摘要及政策建议

在过去十年中,使用重力模型作为分析国际移徙流动的工具的情况大大增加。双边移民数据可用性的提高使研究人员能够分析以前文献中未考虑的拉动和推动因素的作用。利用这些新的数据集,研究人员已经获得了关于网络作用的新证据,或者关于国家之间语言接近的相对贡献的新证据,以帮助解释国际移民流动。作为结构分析的一部分,重力模型也被用来揭示诸如双边签证限制等移民政策的影响。

此外,与以双边贸易为重点的研究最近的发展平行,新的理论和方法的进步使研究人员能够克服使用二元(即双边原产地到目的地)数据所带来的一些方法上的挑战。例如,通过参考RUM模型的基础理论框架,重力模型现在允许研究人员澄清应用研究的关键点,例如需要控制多边对移民的抵制。但是,为了提高重力模型的适用性,还需要进一步注意一些问题,如数据集中存在过多的零或存在内生性问题。

致谢

作者感谢两位匿名审稿人和IZA劳动世界编辑对早期草稿的许多有益建议。作者以前的工作(与Jordi一起Suriñach)包含了大量的背景参考资料,并在本文的所有主要部分中被大量使用(Ramos, R., and J. Suriñach)。欧洲国家与欧盟移民的引力模型。IZA讨论文件第7700号,2013)。

相互竞争的利益

IZA劳动世界项目致力于IZA研究诚信指导原则。作者宣称已遵守这些原则。

©Raul Ramos

证据地图

重力模型:迁移分析的工具

完整的引用

完整的引用

数据源(年代)

数据类型(年代)

方法(年代)

国家