CVPRApr, 2024

数据筛选的缩放定律 —— 数据审查不能忽视计算特性

TL;DR通过引入神经缩放定律来解决数据筛选中的质量 - 数量权衡问题,该定律考虑了网络数据的异质性,为各种质量子集的效用进行特征化,并在多个数据集合的组合中估计模型性能,为数据筛选在不同计算预算下实现最佳性能提供了可能。