BriefGPT.xyz
Ask
alpha
关键词
multi-modal model robustness
搜索结果 - 1
ACL
CARETS: 用于视觉问答的一致性和鲁棒性测试套件
引入 CARETS 系统测试套件,通过一系列六种细粒度能力测试来衡量现代 VQA 模型的一致性和鲁棒性。我们在 CARETS 上评估了六个现代 VQA 系统,并确定了模型理解中的若干可操作性弱点,特别是在否定、或运算或超义不变性等概念方面。
→
PDF
2 years ago
Prev
Next