BriefGPT.xyz
Apr, 2025
合成表格数据基准测试:一个多维评估框架
Benchmarking Synthetic Tabular Data: A Multi-Dimensional Evaluation Framework
HTML
PDF
Andrey Sidorenko, Michael Platzer, Mario Scriminaci, Paul Tiwald
TL;DR
本研究解决了合成数据质量评估这一关键挑战,以保障数据驱动研究中的隐私和效用。我们提出了一种评估框架,通过保持基准策略定量评估合成数据复制原始分布特性的效果,支持多种数据类型,并提供可解释的质量诊断。这些贡献旨在促进合成数据生成技术的可重现性和方法论一致性。
Abstract
Evaluating the quality of
Synthetic Data
remains a key challenge for ensuring
Privacy
and utility in data-driven research. In this work, we present an
→