BriefGPT.xyz
Ask
alpha
关键词
vqa task
搜索结果 - 1
重新思考视觉问答中的评估实践:针对分布外泛化的案例研究
研究大规模多模态数据上预训练的 Vision-and-Language (V&L) 模型在视觉问答 (VQA) 任务中存在代表训练数据的样本分布偏移所造成的 OOD 性能问题,而模型学习的是解决基准测试而不是高层次的技能。本文通过考虑在不同
→
PDF
2 years ago
Prev
Next