May, 2023

合成数据,真实误差:如何(不)发布和使用合成数据

TL;DR本文介绍了通过生成模型生成合成数据,并探讨了生成模型对下游机器学习任务的影响。提出了 Deep Generative Ensemble (DGE) 框架,该框架可以学习生成过程模型参数的后验分布,从而在模型训练、评估和不确定性量化方面取得了显著的改进,特别对于稀有类别和原始数据的低密度区域。