Oct, 2022

机器学习的数据预算

TL;DR本文将数据预算问题研究为两个子问题:预测给定足够数据的饱和性能,以及需要多少数据点才能接近饱和性能。相较于传统的数据独立方法,提出了一种基于学习的方法,并通过 383 个 ML 数据集的经验评估表明,可以仅用 50 个数据点的小型研究数据集进行数据预算。