Sep, 2024
基于运动-外观成本的文本提示跟踪通用多对象的TP-GMOT
TP-GMOT: Tracking Generic Multiple Object by Textual Prompt with
Motion-Appearance Cost (MAC) SORT
TL;DR本研究旨在解决通用多对象跟踪中的先验知识依赖性和类别限制的问题,提出了一个新的文本提示基础的开口词汇框架TP-GMOT。其创新之处在于引入了TP-OD和运动-外观成本SORT (MAC-SORT)两种新组件,显著提高了在未见目标类别下的跟踪能力。研究结果表明,该方法在多个数据集上具有较强的通用性和效果,可能推动多对象跟踪领域的发展。