ICMLJul, 2018

主动测试:一个高效和稳健的估计准确性的框架

TL;DR本研究致力于解决在大型带噪数据集上扩大模型评估规模的问题,并采用主动测试框架,有效查询用户,以最小化审核,测试两种常见计算机视觉任务的性能指标,并表明该方法比其他评估协议更具稳健性,并能节省显着的人工标注工作量。