BriefGPT.xyz
Ask
alpha
关键词
answer grounding
搜索结果 - 2
用于答案定位的句子注意力模块
提出了一种名为 “Sentence Attention Block” 的新型建筑模块,通过明确建模图像特征图与句子嵌入之间的相互依赖关系,重新校准了通道级图像特征图,以过滤基于句子嵌入的不相关特征图通道,进而实现了目前最先进准确度的提高。
PDF
10 months ago
CVPR
如何证明?双重视觉 - 语言交互的答案定位
本文提出了一种名为 DaVI 的新型统一端到端框架,具有语言回答和视觉定位的能力,引入了两种视觉 - 语言交互机制来解决答案定位问题,并在 2022 年 VizWiz 大挑战中获得了第一名。
PDF
2 years ago
Prev
Next