ICCVAug, 2021

DiagViB-6:一套用于视觉模型的诊断基准套件,支持快捷通路和泛化机会的评估

TL;DR本研究发现常见的深度神经网络在预测基本的视觉目标因素(例如形状、颜色或纹理)时也会受到捷径学习的影响,且需要利用视觉数据中的独立性来克服此问题,从而引入了诊断视觉基准套件 DiagViB-6,并基准测试了多种流行的视觉体系结构并表明它们只能在有限程度上利用视觉数据中的独立性。