BriefGPT.xyz
Ask
alpha
关键词
cross-modal attention
搜索结果 - 22
CVPR
跨模态引导擦除的指代表达空间改进
本文提出了一种新的跨模态注意力制导抹除方法,以处理图像和指示表达之间的多种维度的视觉和文本信息,这种方法取得了三个指示表达基准数据集的最先进性能。
PDF
5 years ago
RGB-D 物体检测的跨模态注意力上下文学习
本文提出了一种基于跨模态关注上下文学习框架的方法,通过充分开发 RGB 和深度数据的上下文信息来识别物体。实验证明,该方法在所有公共基准测试中均显著提高了 RGB-D 物体检测的准确性,并提供了可解释的可视化方案。
PDF
6 years ago
Prev
Next