AAAINov, 2018

ABC:在大规模数据集上高效选择机器学习配置

TL;DR研究了在给定一组配置和一个大的数据集随机划分为训练和测试集的情况下,如何在训练集上训练以获取近似最高测试精度的最佳配置,使用置信区间(CI)-based 渐进采样和剪枝策略,能够保证小的精度损失。与使用完整数据寻找精确最佳配置相比,我们的解决方案实现了超过两个数量级的速度提升,而返回的顶部配置具有相同或接近的测试准确性。