Jul, 2024

大规模精细度:按需生成领域特定数据集

TL;DR通过使用Precision at Scale (PaS)方法自动生成特定领域的数据集,该研究证明自动生成的领域特定数据集比大规模监督数据集(如ImageNet-1k和ImageNet-21k)更适合预训练,能够在多个领域和分类任务中以及食品领域中取得至少12%的性能提升,同时数据集体积仅为ImageNet-21k的1/12。