BriefGPT.xyz
Ask
alpha
关键词
visual qa
搜索结果 - 3
自省蒸馏用于稳健问答
本文提出了一种名为 Introspective Distillation(IntroD)的新型去偏差方法,通过内省训练样本是否适合现实 ID 世界或对立 OOO 世界来融合 OOD 和 ID 的归纳偏差,用于解决语言和阅读理解等领域中 QA
→
PDF
3 years ago
ECCV
早期融合和批次规范对 CLEVR 视觉问答中细节的影响
本文研究了在 Visual QA 领域中取得强大性能的初馈聚合模型的复杂性,发现了一些架构上的要素对于其性能的关键作用,其中早期的语言 - 视觉融合是最为有效的,为此我们提出了一种称之为 “多模核” 的简单模块,旨在为多模任务提供基本操作。
PDF
6 years ago
ICCV
电影故事理解的读写记忆网络
我们提出了一种名为 Read-Write 记忆网络 (RWMN) 的新型记忆网络模型,用于大规模、多模态电影故事理解的问答任务。我们的 RWMN 模型的重点是设计读取网络和写入网络,由多个卷积层组成,从而使内存读取和写入操作具有高容量和灵活
→
PDF
7 years ago
Prev
Next