Mar, 2024

探索数据集偏差对数据集提炼的影响

TL;DR利用数据集正规化技术(Dataset Distillation, DD)生成小规模的合成数据集,探究数据集偏倚对DD性能的影响并提出应对方法,实验证明原始数据集中的偏倚显著影响合成数据集的性能,突出了在DD过程中识别和减轻偏倚的必要性。