Jul, 2019

使用自然语言描述的实时视觉目标跟踪

TL;DR该研究提出一种利用自然语言描述的深度追踪器,通过使用 LSTM 跟踪器预测目标的更新,可以以每秒超过 30 帧的速度处理具有模糊语言注释的目标,展示出色的性能。