Nov, 2023

超越视觉线索:同步探索面向目标的语义用于视觉 - 语言追踪

TL;DR这篇研究论文介绍了一种新颖的追踪器,通过逐步探索目标中心语义来进行视觉 - 语言追踪,其中包括两个关键模块:目标增强模块(TEM)和语义感知模块(SAM),并采用密集匹配损失以增强多模态表示学习。实验证明了该方法的优越性和有效性。