2019年1月

IZA DP第12081号:lassopack:Stata中正则化回归的模型选择和预测

本文介绍了lassopack,一套用于Stata中正则化回归的程序。lassopack实现了套索、平方根套索、弹性网、岭回归、自适应套索和后估计OLS。这些方法适用于高维环境,其中预测器的数量p可能较大,并且可能大于观测值的数量n。我们提供三种不同的方法来选择惩罚(“调整”)参数:信息标准(在lasso2中实现)、横截面、面板和时间序列数据的K倍交叉验证和h步超前滚动交叉验证(cvlasso)以及理论驱动(“严格”)横截面和面板数据的套索和平方根套索的惩罚(rlasso)。我们将讨论每种方法的理论框架和实践考虑。我们还提供了蒙特卡罗结果来比较惩罚方法的性能。