Jun, 2024

CTSyn: 跨表数据生成的基础模型

TL;DR介绍了一种针对表格数据生成的基于扩散的跨表合成器(CTSyn),通过整合异构表格数据、条件潜在扩散模型和类型特定解码器,从采样的潜在向量中重构不同数据类型的值,提高了合成功能和多样性,同时在下游机器学习任务中表现出对真实数据无法达到的性能提升,从而为合成数据生成建立了新的范式。