Apr, 2024

MLS-Track:RMOT 中的多层语义交互

TL;DR通过使用 Unreal Engine 5 构建了一个名为 Refer-UE-City 的全新基准数据集,其中包括了交叉口监控视频中的人和车的外观和行为细节,并提出了一种多层语义引导的多目标追踪框架 MLS-Track,通过引入语义引导模块 (SGM) 和语义相关分支 (SCB) 逐层增强模型与文本之间的交互,实验结果表明该框架具有最先进的性能。