BriefGPT.xyz
Ask
alpha
关键词
transformer-based method
搜索结果 - 23
ICCV
谁是沃尔多?链接文本和图像中的人物
我们提出了一个任务和基准数据集,用于个体中心的视觉定位,这个问题是将标题中命名的人物与图像中出现的人物联系起来。为了鼓励方法关注上下文线索(如多个人之间的丰富互动),而不是学习名称和外观之间的关联,我们的新任务遮盖了标题中的人名。为了促进这
→
PDF
3 years ago
利用 Transformer 提升 Few-shot 语义分割
本文提出了一种基于 TRansformer 网络的 Few-shot 语义分割方法(TRFS),它采用全局增强模块(GEM)和局部增强模块(LEM)相结合的方法,可以在 PASCAL-5i 和 COCO 数据集上取得新的最优表现。
PDF
3 years ago
使用 Transformer 进行端到端时序动作检测
本研究提出了一种基于 Transformer 的时态动作检测方法,通过少量学习嵌入(称为动作查询)从视频中自适应地提取时间上下文信息,并直接预测动作实例的时间间隔和语义标签,通过三种改进提高本地化意识,实现了端到端的学习,并取得了与现有方法
→
PDF
3 years ago
Prev
Next