Jan, 2024

针对合成数据的下游任务导向生成模型选择 —— 用于欺诈检测模型的训练

TL;DR在选择适合特定的机器学习模型类和性能度量组合的合成训练任务的最佳生成模型的过程中,我们的研究发现,当模型解释性要求苛刻时,基于贝叶斯网络的生成模型优于基于神经网络的生成模型。我们的结果为有意将训练数据从真实数据集替换为合成数据集的机器学习从业者提供了实际指导,并为更一般的下游任务导向的生成模型选择问题提供了启示。