BriefGPT.xyz
大模型
Ask
alpha
关键词
state-of-the-art records
搜索结果 - 2
TMT-VIS: 视频实例分割的层级感知多数据集联合训练
通过提供额外的分类信息,我们提出了一种名为 TMT-VIS 的模型,用于视频实例分割的多数据集联合训练,该模型在四个流行且具有挑战性的基准测试中均显著改善了基线解决方案,并创下了新的最先进记录。
PDF
7 months ago
CVPR
Transformer Meets Tracker: 挖掘时间上下文,提高鲁棒性视觉跟踪
本文提出了一个基于 transformer 的视频物体跟踪器,在 Siamese-like 跟踪管道中,编码器在模板中注入了基于注意力机制的特征强化以增强模型生成质量,解码器传递上一个模板的跟踪线索到当前帧以方便目标搜索,结果本方法作为一种
→
PDF
3 years ago
Prev
Next