BriefGPT.xyz
Ask
alpha
关键词
co-attention models
搜索结果 - 2
ACL
视觉对话中的历史记录:我们真的需要吗?
本文提出基于对话历史信息的注意力机制可以有效提高视觉对话系统的性能,并呈现出一种新的评估数据集进行基准测试,取得了 63% 的 NDCG 值。
PDF
4 years ago
多模式统一关注网络用于视觉语言交互
本研究提出了一种统一的注意力模型,能够同时捕捉多模态特征的内部和跨模态之间的相互作用,并输出相应的注意力表示。通过堆叠这样的统一注意力块,我们获得了深度多模态统一注意力网络 (MUAN),可以无缝地应用于视觉问答 (VQA) 和视觉定位任务
→
PDF
5 years ago
Prev
Next