BriefGPT.xyz
Ask
alpha
关键词
bottom-up attention
搜索结果 - 4
为视觉问答辩护的网格特征
本文探讨了基于 Bounding Box/Region 的 Bottom-up attention 方法是否是解决 Vision and Language 任务(如视觉问答(VQA))成功的关键因素,结果发现与 grid features
→
PDF
4 years ago
视觉问答的互注意融合
该研究提出了一种新的注意力机制,同时考虑视觉细节的两个层次,即物体实例和它们的部分,通过高效的张量分解方案,设计了分层融合多模态信息的模型并提高了已有模型达到了一个显著的提升。
PDF
6 years ago
CVPR
视觉问答技巧:2017 年挑战赛收获
本文介绍了一个用于视觉问答(VQA)的最先进模型,这个模型在 2017 年的 VQA 挑战中获得了第一名。通过对超过 3,000 个 GPU 小时的架构和超参数的深入探索,我们发现了许多用于提高性能的 Tips and Tricks。我们详
→
PDF
7 years ago
CVPR
基于自下而上和自上而下的注意力机制用于图像字幕生成与视觉问答
本篇研究提出一种混合自下而上和自上而下视觉关注机制,能在对象和其他显著图像区域的水平上计算注意力权重,实现更深入图像理解,将其应用于图像字幕生成和视觉问答任务中,取得了优于现有技术的成绩。
PDF
7 years ago
Prev
Next