ICCVAug, 2023

视频目标检测的一致身份聚合

TL;DR本文提出了一种使用 Identity-Consistent Aggregation (ICA) 层的 VID 模型 ClipVID,旨在改善 Video Object Detection 中的对象表示和处理对象外观变化。在 ImageNet VID 数据集上,我们的方法表现出 84.7% 的最佳性能,速度比之前的最佳性能快 7 倍 (39.3 fps)。