2023年2月

IZA DP No. 15941:关于使用网页文本识别调查目标人群的有效性:一种检测在线平台的应用程序

按实际使用量付费饶舌的人,沃尔特HassinkBart Klijs

建立了一个统计分类模型,根据其网站上的文本来识别在线平台组织。该模型随后被用于识别所有(潜在的)平台组织,其网站包括在荷兰商业登记簿中。统计模型的实证结果在单词和拟合概率的双峰分布方面是可信的,但结果表明高估了平台组织的数量。接下来,通过在统计分类模型确定为平台组织的组织下进行的调查来调查结果的外部有效性。各组织对调查的答复证实了大量的第一类错误。此外,它揭示了基于文本的分类模型的拟合概率与组织对作为在线平台组织的调查问题的回答之间的正相关。调查结果表明,基于文本的分类模型可用于从拥有网站的整个企业群体中获得潜在平台组织的子群体。