ICMLMay, 2024

机器学习中个体数据点价值的尺度定律

TL;DR我们通过研究个体数据点的比例行为来揭示数据点的价值随数据集规模的变化而逐渐减少的情况,并提供了支持我们的比例定律的学习理论,此定律在不同的模型类别中得到验证。我们进一步提出了最大似然估算器和分摊估算器,以有效地学习每个数据点的个别比例行为,我们利用这些估算器揭示了影响不同数据点比例行为的因素,并将这些个体比例法则应用于数据估值和数据子集选择。