Feb, 2024

EchoTrack: 自主驾驶中的听觉参考多目标追踪

TL;DR通过音频和视频融合的双流视觉变换框架,本研究提出了 EchoTrack 模型,解决了自动驾驶中的 Auditory Referring Multi-Object Tracking 问题,并建立了一套大规模的 AR-MOT 基准测试集。