eMoE-Tracker:基于环境 MoE 的 Transformer 用于鲁棒的事件导向目标跟踪
本研究通过复制现有的最先进(SOTA)时空转换器模型,以尽可能符合计算限制,并批判性评估现有模型架构的优势和改进机会,以解决实时推理速度挑战,并在空间 - 时间 (ST) 关注层中引入专家混合 (MoE) 块来提高模型容量和降低推理成本。
May, 2024
通过混合专家框架和创新的门控函数,本研究介绍了 FuseMoE 模型,该模型可以有效地处理多模态数据、缺失模态以及时间上的不规则和稀疏采样数据,从而改善模型预测性能。通过临床风险预测任务的验证,证实了 FuseMoE 在实际应用中的实用性。
Feb, 2024
提出了一个综合的多目标跟踪方法 STMMOT,该方法结合了目标检测和身份链接,能够在长时间内维持目标身份链接,并利用具有注意力机制的鲁棒时空记忆模块和动态查询嵌入来预测目标状态,消除了后处理的需求。
Dec, 2023
基于 CBNetV2 和 Swin-B 的检测模型以及 MoCo-v2 的自监督外观模型,我们探索了一种新的 SOTA 方向,通过去除运动信息和 IoU 映射,取得了在 CVPR2023 WAD 研讨会的 MOTS 轨迹上的第一名以及 MOT 轨迹上的第二名的简单有效方法。
Aug, 2023
通过使用 SpikeMOT,一种基于事件的多目标跟踪器,利用脉冲神经网络从事件流中提取了稀疏的时空特征来高频率地追踪物体的运动,并在等效帧率下提供更新的空间信息,从而实现了在复杂背景和相机运动干扰下具有高跟踪精度的实时目标跟踪。
Sep, 2023
提出了一种基于 Transformer 的多模态传感器输入的端到端多目标跟踪算法(MotionTrack),它由基于 Transformer 的数据关联(DA)模块和基于 Transformer 的查询增强模块组成,同时实现了多目标检测(MOD)。MotionTrack 及其变体在 nuScenes 数据集上获得更好的结果(AMOTA 得分为 0.55),与 AB3DMOT、CenterTrack 和概率 3D 卡尔曼滤波器等经典基线模型相比有着更好的表现。
Jun, 2023
提出了一种基于运动的多目标跟踪方法,称为 ETTrack,它融合了变换器模型和时间卷积网络,利用历史运动信息预测个体物体的未来运动,并通过新颖的动量修正损失函数提高了预测准确性,实验证明 ETTrack 在 DanceTrack 和 SportsMOT 上取得了与最先进跟踪器竞争性的性能,分别达到 56.4%和 74.4%的 HOTA 指标。
May, 2024
本研究提出了一种新型的多模态混合跟踪器 (MMHT),利用基于帧事件的数据进行可靠的单目标跟踪,通过使用人工神经网络(ANN)和脉冲神经网络(SNN)构建混合骨干,并使用增强的基于 Transformer 的模块通过注意机制融合多模态特征,构建多尺度和多维度的视觉特征空间,从而实现了有益的特征建模。实验结果表明,MMHT 模型在解决视觉目标跟踪任务中面临的挑战方面具有竞争力。
May, 2024
提出了一种鲁棒的目标建模框架(ROMTrack),同时对固有模板和混合模板特征进行建模,通过结合目标对象的固有特征和搜索区域的引导来抑制有害干扰物,并使用混合模板提取与目标相关的特征,从而实现更强大的目标建模框架。
Aug, 2023
该研究提出了一个通用的、传感器无关的多模态多目标跟踪框架,通过在数据关联过程中编码点云的深度表示,使每种模态能够独立执行其职能以保证其可靠性,并通过新型的多模态融合模块进一步提高其精度。该框架在 KITTI 基准上的表现达到了最新水平。
Sep, 2019