May, 2019

基于逐帧运动和外观的实时多目标跟踪

TL;DR本文提出了一种高效的深度神经网络方法 ——FMA,计算两个视频帧之间的 Framewise Motion Fields,并对大量对象的边界框进行快速可靠匹配,同时实现 Frame-wise Appearance Features 的学习,以达到实时多目标跟踪并取得与现有最先进方法相竞争的结果。