May, 2020

从 ImageNet 到图像分类:基准测试上的进展与语境

TL;DR通过人工研究这项工作研究了采用众包数据收集管道构建丰富的机器学习数据集的后果,重点关注了流行的 ImageNet 数据集,在 ImageNet 创建过程中特定的设计选择如何影响所得到的数据集的保真度,以及噪声数据收集管道如何导致所得基准与其代理真实世界任务之间存在系统性偏差。最后,发现需要扩充我们的模型培训和评估工具包,以考虑这种不对齐现象。