Dec, 2023

合成数据:能否信任统计估计器?

TL;DR在研究中,我们强调了推论效用的重要性,并提供了反对从合成数据(处理这些数据就好像它们是真实观察到的一样)进行天真推断的实证证据,我们认为即使估计是无偏的,阳性结果的率(类型 1 错误)将会不可接受地高,一个原因是低估了真实标准误差,它可能会随着更大样本量而逐渐增加,导致收敛较慢。这对于深度生成模型尤其是一个问题。在发布合成数据之前,开发针对这样的数据的统计推断工具至关重要。