Mar, 2024

探索数据集偏差对数据集提炼的影响

TL;DR利用数据集正规化技术 (Dataset Distillation, DD) 生成小规模的合成数据集,探究数据集偏倚对 DD 性能的影响并提出应对方法,实验证明原始数据集中的偏倚显著影响合成数据集的性能,突出了在 DD 过程中识别和减轻偏倚的必要性。