- 自适应绕过视觉转换块以实现高效的视觉跟踪
通过自适应计算框架 ABTrack,以及采用剪枝技术和绕过决策模块,本研究提出了一种提高视觉跟踪效率的方式,并通过在多个跟踪基准上进行的大量实验证明了其有效性和卓越性能。
- 通过迭代梯度下降和阈值选择实现鲁棒性视觉跟踪
基于鲁棒回归的视觉跟踪技术中,引入了一种新的鲁棒线性回归估计器,通过迭代梯度下降和阈值选择算法解决异常值问题,同时将算法扩展到生成式跟踪器,并使用 IGDTS 距离来衡量样本与模型之间的偏差,最后提出了一种更新方案以捕捉跟踪目标的外观变化并 - 跟踪与 LoRA: 更快的训练、更大的模型、更强的性能
通过 LoRAT 方法,将 Vision Transformers (ViT) 应用于实验室级资源内的视觉跟踪,通过解决独特的挑战和潜在域差异,包括将位置嵌入分解为共享的空间嵌入和独立的类型嵌入,并设计了仅基于多层感知器 (MLP) 的自由 - VastTrack:广阔类别的视觉目标跟踪
通过引入一个名为 VastTrack 的新型基准,本文旨在促进更加通用的视觉跟踪算法的发展,包括丰富的类别和视频,它具有大量目标类别、更大的规模、丰富的注释等吸引人的特性。
- 直接视觉提示用于视觉目标跟踪
提出了一种基于明确视觉提示框架的视觉跟踪方法 EVPTrack,通过利用时空令牌在连续帧之间传播信息,生成明确的视觉提示,从而有效利用时空和多尺度信息,提升了模型的效率和性能。
- ODTrack: 在线稠密时序令牌学习用于视觉跟踪
在线图像跟踪中,稀疏的时间关系会限制引用帧和搜索帧之间的联合处理,为了解决这一问题,本文提出了一种名为 ODTrack 的简洁、灵活、有效的视频级跟踪方法,通过在线令牌传播方式密集地关联视频帧的背景关系,从而在多个基准测试中取得了先进的性能 - 跨模式目标跟踪通过模态感知融合网络和大规模数据集
提出了一种自适应跨模态目标跟踪算法 Modality-Aware Fusion Network(MAFNet),它通过自适应加权机制有效地整合 RGB 和近红外模态的信息,弥合了外观差距,实现了模态感知的目标表示。
- 利用图像相关的归纳偏见在单支视觉跟踪中的应用
提出了一种自适应 ViT 模型预测跟踪器 (AViTMP),通过引入适配器模块和联合目标状态嵌入来丰富基于 ViT 的稠密嵌入范式,并结合了稠密融合解码器和判别式目标模型以预测准确位置。通过双向循环跟踪验证的循环跟踪方法 CycleTrac - 分阶段深度相关和特征融合用于孪生物体追踪
我们提出了一种名为 DCFFNet 的新型分阶段深度相关性和特征融合网络,用于进一步优化可视化跟踪的特征提取。我们基于孪生网络架构构建了我们的深度跟踪器,该网络从头开始离线训练,利用多个大规模数据集进行端到端训练。我们将改进的 ResNet - 基于事件流的视觉目标跟踪:一个高分辨率基准数据集和一种新的基线模型
通过多模态跟踪和知识蒸馏方法,在高分辨率事件信号下实现了高速低延迟的视觉跟踪的研究。
- ICCVCiteTracker:用于视觉跟踪的图像和文本相关联
我们提出了 CiteTracker,通过连接图像和文本来增强视觉跟踪中的目标建模和推断。我们开发了一个文本生成模块,将目标图像补丁转换为一个包含其类别和属性信息的描述性文本,为目标提供综合参考点。此外,设计了一个动态描述模块以适应目标变化, - 基于时间上下文的真实世界视觉跟踪
提出了一种利用时间上下文的双层框架 (TCTrack),用于实现更强大的现实世界视觉跟踪,并在特征提取和相似度图优化方面进行了改进。
- 低复杂度的多维 DCT 近似
本文介绍了低复杂度的多维离散余弦变换 (DCT) 近似算法,基于高阶张量理论,我们提出了几种 $8 imes 8 imes 8$ 的近似方法,并将其嵌入到基于 3D DCT 的视频编码方案中,同时引入了改进的量化步骤,模拟结果表明所提出的 - 使用顶部和背部视角的无人机视频姿态信息估计羽毛球双打的控制区域
本研究提出了一种基于视觉跟踪和深度神经网络的框架,通过控制区域概率图来评估双打比赛中的团队合作表现,并验证了其在实验室中的有效性,可以为比赛提供有价值的位置评估和指导。
- CVPR在野外环境中跟踪容器和遮挡物
本文介绍了一个名为 $ extbf {TCOW}$ 的新基准和模型,用于在存在较强遮挡和包容的情况下进行视觉跟踪,并通过混合数据集支持模型性能的监督学习和结构化评估。该文还测试了两种基于 transformer 的视频模型在跟踪任务上的表现 - CVPRSeqTrack:用于视觉目标追踪的序列到序列学习
本论文提出了一个新的序列到序列学习框架 SeqTrack 来进行视觉跟踪,将视觉跟踪作为一个序列生成问题,该问题可以在自回归的基础上预测物体的边界框,SeqTrack 架构只采用一个简单的编码器解码器变压器架构,并在多个基准测试上达到了竞争 - CVPR单目视频中滑雪者轨迹的可视化
本文提出 SkiTraVis 算法,通过视觉跟踪模型和帧对应模块来可视化滑雪者的动作轨迹,结果证明该方案具有潜力来增强广播媒体和助理教练。
- ECCVAiATrack:基于 Transformer 的视觉跟踪关注层设计
提出改进注意力机制的注意力内注意(AiA)模块及优化特征聚合和信息传递的 Transformer 跟踪框架 AiATrack,在多个定位基准测试上实现了最先进的性能表现。
- 多智能体强化学习基础束搜索跟踪
本文提出了一种基于多智能体强化学习的射线追踪策略,称之为 BeamTracking,主要通过维护多个跟踪轨迹和应用射线搜索策略来跟踪视频中的目标。经实验证明,该策略在处理具有挑战性的追踪任务时表现出色。
- IJCAI稀疏 Transformer 视觉跟踪
通过引入稀疏注意力机制和双头预测器,成功地解决了基于 Transformer 模型的视觉跟踪任务中自注意力机制关注背景信息而影响性能的问题,并在 LaSOT、GOT-10k、TrackingNet 和 UAV123 等数据集中表现出显著的跟