2020年3月

IZA DP No. 13029:用于启动性能预测的公共可用、文本和非文本信息的价值

论文发表于:商业风险管理,2020,14,e00179

在早期阶段,可以使用公开的、从网络上抓取的数据来识别有前途的创业公司吗?为了回答这个问题,我们使用这些关于丹麦公司名称及其地址的文本和非文本信息,以及他们的商业目的声明(bps),并辅以核心会计信息以及创始人和初始启动特征来预测新启动企业在五年时间范围内的绩效。我们考虑的绩效结果是非自愿退出、高于平均水平的就业增长、超过20%的资产回报率、新专利申请和参与创新补贴计划。我们的第一个关键发现是,我们的模型预测创业公司的业绩具有很高或非常高的准确性,除了预测能力仍然很差的高资产回报。我们的第二个关键发现是,以这种精度预测性能结果所需的数据很低。为了很好地预测两种与创新相关的绩效结果,我们只需要包括一组来自BPS文本的变量,而准确预测创业公司的生存和高就业增长需要以下几个方面的结合:(1)来自创业公司名称的信息;(ii)与创始人相关的基本特征数据;(iii)描述初创公司初始特征的变量(预测初创公司的生存)或企业目标声明信息(预测高就业增长)。这些变量集很容易获得,因为在企业注册时必须报告底层信息。我们对生存、就业增长、新专利和参与创新补贴计划的预测具有相当的准确性,这表明算法评分模型有足够的空间作为资助和创新支持决策的额外支柱。

关键字

凝胶代码