2020年3月

IZA DP No. 13029:公开可用、文本和非文本信息对启动性能预测的价值

发表于:Journal of Business ventures Insights

在早期阶段,网络搜集的公开数据可以用来识别有前途的创业公司吗?为了回答这个问题,我们使用这样的文本和分文本信息丹麦公司的名称和地址以及他们的商业目的语句(bps)辅以核心会计信息以及创始人和初始启动特性预测性能的新开始企业五年以上时间范围。我们考虑的绩效结果是:非自愿退出、高于平均水平的就业增长、超过20%的资产回报率、新专利申请和参与创新补贴计划。我们的第一个关键发现是,我们的模型对初创企业业绩的预测精确度很高或非常高,但对高回报资产的预测能力仍然很差。我们的第二个关键发现是,预测如此精确的性能结果的数据需求很低。为了更好地预测两种与创新相关的绩效结果,我们只需要包括一组来自BPS文本的变量,而准确预测初创企业生存和高就业增长需要结合(i)来自初创企业名称的信息,(ii)初级创始人相关特征的数据和(iii)描述初创企业初始特征的变量(用于预测初创企业的生存)或商业目的陈述信息(用于预测高就业增长)。这些变量集很容易获得,因为在商业登记时必须报告基础信息。我们对生存、就业增长、新专利和创新补贴计划参与情况的预测非常准确,这表明算法评分模型作为资助和创新支持决策的额外支柱有足够的空间。

关键字

凝胶代码