BriefGPT.xyz
Ask
alpha
关键词
vision-language tracking
搜索结果 - 3
超越视觉线索:同步探索面向目标的语义用于视觉 - 语言追踪
这篇研究论文介绍了一种新颖的追踪器,通过逐步探索目标中心语义来进行视觉 - 语言追踪,其中包括两个关键模块:目标增强模块(TEM)和语义感知模块(SAM),并采用密集匹配损失以增强多模态表示学习。实验证明了该方法的优越性和有效性。
PDF
7 months ago
迈向视觉语言跟踪的统一标记学习
该研究提出了一种简单、灵活且有效的视觉 - 语言(VL)跟踪管道,称为 MMTrack,它将 VL 跟踪视为一个标记生成任务,并通过将语言描述和边界框序列化为一系列离散标记来实现。通过避免多个子任务的学习和手动设计的损失函数,该设计范式极大
→
PDF
10 months ago
一体化探索:多模态对齐下的统一视觉语言跟踪
现有主流的视觉语言(VL)跟踪框架由三部分组成,即视觉特征提取器,语言特征提取器和融合模型。本文提出了一个全新的、一体化的框架,通过采用统一的 Transformer 骨干结构,学习联合特征提取和交互,实现了特征的统一融合,消除了特征集成和
→
PDF
a year ago
Prev
Next