Dec, 2023
关于精简数据集的多样性和真实性:一种高效的数据集精简范式
On the Diversity and Realism of Distilled Dataset: An Efficient Dataset Distillation Paradigm
Peng Sun, Bei Shi, Daiwei Yu, Tao Lin
TL;DR用于大规模真实数据集的数据集压缩方法 RDED 能够在短短 7 分钟内将完整的 ImageNet-1K 压缩为每类只有 10 张图像的小型数据集,并在单个 RTX-4090 GPU 上以 42% 的 Top-1 精度实现了显著的性能提升(而目前最先进方法仅达到 21% 的精度,且需要 6 小时)。