2019年1月

IZA DP No. 12081: lasassopack: Stata中正则化回归的模型选择和预测

本文将介绍lassopack,这是Stata中用于正则化回归的一套程序。lasassopack实现套索,平方根套索,弹性网,脊回归,自适应套索和后估计OLS。这些方法适用于高维设置,其中预测因子p的数量可能很大,并且可能大于观测值n。我们提供了三种不同的方法来选择惩罚('调优')参数:信息标准(在lasso2中实现),截面、面板和时间序列数据的K-fold交叉验证和h-step ahead滚动交叉验证(cvlasso),以及截面和面板数据的套索和平方根套索的理论驱动(“严格”)惩罚(rlasso)。我们将讨论每种方法的理论框架和实际考虑因素。我们还提出了蒙特卡洛结果来比较惩罚方法的性能。