2018年4月

IZA DP No. 11503:关于在线调查数据可靠性的警告:以工资指标为例

即将发表于:社会学方法与研究,doi.org/10.1177/0049124118782538

我们调查了工资指标(WI)数据的可靠性,这是关于收入和工作条件的最大在线调查。将WI与17个国家具有全国代表性的数据源进行比较,可以发现WI的参与者不太可能从各自的人口中具有代表性。以前的文献提出了利用基于逆倾向分数的权重,但这一过程表明,重新加权的WI样本与全国代表性的基准数据不同。我们提出了一种基于协变量平衡倾向评分的新程序,该程序实现了WI数据的完全重加权,使其能够在可观察特征上复制全国代表性样本的结构。虽然重新平衡确保了WI和代表性基准数据源之间的匹配,但我们表明,对于一大批国家来说,工资表仍然不同。以明氏工资回归为例,我们发现在超过三分之一的情况下,我们提出的新颖加权确保了基于WI数据获得的估计值相对于具有全国代表性的数据不存在偏见。然而,在所分析的95个数据集中的其余60%中,WI和全国代表性数据之间的Mincerian工资回归估计系数的系统性差异即使在重新加权后仍然存在。我们提供了一些关于这些偏见背后原因的直觉。值得注意的是,客观因素,如互联网接入或富裕程度似乎很重要,但WI参与者的自我选择(关于不可观察的特征)似乎构成了偏见的重要来源。