Jul, 2022

我需要多少更多的数据?——预估下游任务的需求

TL;DR本文研究机器学习系统的数据需求估计问题,通过探究一系列广义幂律函数来更准确地估计数据集规模与目标性能之间的关系,并通过引入校正因子和多轮数据采集策略来优化数据需求估计模型,从而实现开发时间和数据获取成本的节省。