BriefGPT.xyz
Ask
alpha
关键词
vision-language representation
搜索结果 - 2
将更多关注转移到视觉语言对象追踪上
我们设计了一种有效的视觉 - 语言表示方法,同时为追踪问题构建了一个大型带有语言注释的数据库。通过引入异构架构搜索和模态混合器等核心技术,以及对不同模态之间进行对比损失的引入,我们能够显著改善追踪问题的解决方案,并期望将更多注意力转向视觉
→
PDF
a year ago
层次化视觉语言表示的多任务学习
该研究提出了一种多任务学习的方法,将来自各种不同数据集的任务共享视觉语言表示。结果表明该方法在图像字幕检索、视觉问答和视觉定位方面比先前的单任务学习方法表现更好,同时通过可视化注意力图分析了学习到的分层表示。
PDF
6 years ago
Prev
Next