Mar, 2021

机器学习基准测试中方差的考虑

TL;DR通过模拟对比机器学习算法的整个基准测试过程,我们发现数据采样、参数初始化和超参数选择对结果的影响显著。进一步分析今天所用的主要比较方法,我们提出一种反直觉的结果,即在不增加计算成本的情况下,将更多的变化源添加到不完美的估计器中可以接近更理想的估计器。通过五个不同的深度学习任务和架构,分析改进检测错误率,提出了性能比较的建议。