BriefGPT.xyz
Ask
alpha
关键词
pairwise attention
搜索结果 - 2
TokenLearner:8 个学习到的令牌能为图像和视频做什么?
本文介绍了一种新的视觉表示学习方法,它依赖于少量自适应学习的令牌,并适用于图像和视频理解任务。与依赖手动设计的分割策略和处理大量密集抽样补丁以获取注意力的方法不同,我们的方法学习从视觉数据中挖掘重要令牌,从而有效地找到一些重要的视觉令牌,并
→
PDF
3 years ago
MM
基于知识引导的弱监督指代消解对生成网络
本文提出一种基于知识引导的配对重构网络(KPRN)框架来解决弱监督参考表达基础(REG)问题,并进行了四个大规模数据集的实验来展现模型的优异性能。
PDF
5 years ago
Prev
Next