Jun, 2019

图像分类器是否具有时间上的泛化能力?

TL;DR本文研究图像分类器对视频时序扰动的鲁棒性。我们构建了两个数据集,ImageNet-Vid-Robust 和 YTBB-Robust,包含 57,897 张图像,分为 3,139 组感知相似图像,并对其进行了重新注释以进行相似性分析。我们评估了各种经过 ImageNet 预训练的分类器,结果显示在两个数据集上的中位分类准确性分别下降了 16 和 10。此外,我们还评估了三个检测模型,并显示自然扰动会引起分类和定位误差,导致检测 mAP 中位数下降 14 个点。我们的分析表明,视频中自然发生的扰动对于在需要可靠和低延迟预测的环境中部署卷积神经网络是一个实际而重大的挑战。