视频目标检测的一致身份聚合

ICCVAug, 2023

Identity-Consistent Aggregation for Video Object Detection

Chaorui Deng, Da Chen, Qi Wu

TL;DR本文提出了一种使用 Identity-Consistent Aggregation (ICA) 层的 VID 模型 ClipVID，旨在改善 Video Object Detection 中的对象表示和处理对象外观变化。在 ImageNet VID 数据集上，我们的方法表现出 84.7% 的最佳性能，速度比之前的最佳性能快 7 倍 (39.3 fps)。

Abstract

In video object detection (VID), a common practice is to leverage the rich temporal contexts from the video to enhance the object representations

video object detection temporal contexts object representations identity-consistent aggregation sota performance

发现论文，激发创造

视频目标检测的序列级语义聚合

本研究提出了一种基于全序列级别的特征聚合方法（SELSA），用于视频目标检测，实现了更具区分性和更健壮的特征，同时创造了新的视角来理解 VID 问题。此法不需要 Seq-NMS 或 Tubelet 重评分等复杂的后处理方法，保持了管道的简洁明了，并在 ImageNet VID 和 EPIC KITCHENS 数据集上实现了新的最先进结果。

Jul, 2019

基于实例的身份：视频实例分割的通用在线范式

本文提出了一种新的在线视频实例分割范例，名为 Instance As Identity (IAI)，通过使用新的识别和关联模块，将时态信息集成到在线模型中，成功地在三个不同的半监督挑战中超越了所有的竞争者。

Aug, 2022

基于重识别的视频目标分割

本文提出了一种基于视频对象重识别的视频分割方法，通过使用自适应的目标重识别机制来避免传统方法中的漂移问题和无法处理大位移的弊端，该方法在 2017 年 DAVIS Challenge 中取得了最佳性能。

Aug, 2017

利用学习的剪辑相似度聚合进行视频人员再识别

该研究使用学习到的视频片段相似度聚合函数，以筛选出更具信息量的片段对，结合使用 3D CNNs 以及 RGB 输入，对三个具有挑战性的公开基准进行定量和定性验证，表现出更好或相当的性能。

Oct, 2019

基于流引导的视频目标检测特征聚合

该研究提出了一种基于流引导特征聚合的视频物体检测学习框架，该框架通过沿着运动路径聚合邻近特征来提高视频的识别精度，避免了视频中物体外观退化的问题，并且完全可训练，与 ImageNet VID 挑战的最佳工程系统相当

Mar, 2017

逐帧视频目标分割

本文提出了一种基于片段的推理方案，用于半监督视频分割，得到了最先进的表现，包括准确性和效率收益，通过夹杂在一段时间内进行两次推断和显式改进内部特性的片段操作，以及在片段内部推广匹配机制等模块的协同作用。

Aug, 2022

利用时序相干性进行自监督单次视频再识别

本文提出了一种新的基于时间一致性递进学习的框架，利用自监督辅助任务来捕捉未被标记的轨迹之间的关系，从而更好地实现视频检索中的标记，相比现有技术提高了高达 8% 的未标记数据真实标记的准确性和重识别的性能。

Jul, 2020

基于 3D 卷积网络和非局部注意力的基于视频的人员再识别

本研究旨在解决视频行人重新识别中的空间对齐问题和时间依赖性问题，提出了一种使用 3D 卷积和非局部块进行特征聚合的网络架构，实验结果表明该方法在多个指标上的性能均优于现有技术。

Jul, 2018

无监督领域自适应人员识别的联合视觉和时间一致性

本文提出了一种通过结合局部单热分类和全局多类分类来同时保证视觉一致性和时间一致性，利用未标记的数据进行鉴别特征学习的统一框架方法，该方法在三个大规模 ReID 数据集上的实验结果表明其在无监督和半监督领域适应 ReID 任务方面的优越性。

Jul, 2020

高质量物体链接的视频目标检测

本研究介绍了一种新的视频目标检测方法，采用时序上下文方法来链接同一对象，从而提高分类准确率。该方法在 ImageNet VID 数据集上的表现优于静态图像检测器和先前的最新技术。

Jan, 2018