Sep, 2018

CaTDet: 用于视频中高效目标检测的级联跟踪检测器

TL;DR本文提出了一种名为 CaTDet 的系统,它通过利用视频中的时间相关性加快物体检测的速度。该系统由两个 DNN 模型和一个额外的跟踪器组成,用于预测历史检测的感兴趣区域,并使用设计用于延迟关键视频应用的新度量 mean Delay(mD)。实验结果表明,在 KITTI 数据集上,CaTDet 将操作次数降低了 5.1-8.7 倍,并具有与单模型 Faster R-CNN 检测器相同的平均精度(mAP),而额外的延迟仅为 0.3 帧。在 CityPersons 数据集上,CaTDet 减少了 13.0 倍的操作,并损失 0.8%的 mAP。