基于流引导的视频目标检测特征聚合
我们在视频中对象的分割问题上提出了一种新的管道(FODVid),它基于使用流引导图割和时间一致性的思想来引导分割输出,通过设计一个融合了帧内外观和流相似性以及帧间对象时间持续性的分割模型,我们的方法在无监督的视频对象分割中取得了与现有顶级方法相当的结果(在 mIoU 范围内相差约 2 个单位),我们技术的简单性和效果为视频领域的研究开辟了新的研究途径。
Jul, 2023
提出了一种基于可学习的空间 - 时间采样 (LSTS) 模块、分散递归特征更新 (SRFU) 和密集特征聚合 (DFA) 模块,实现了视频目标检测中的准确空间对应关系,增强特征更新,提升检测性能,并在 ImageNet VID 数据集上取得了最先进的表现和实时速度。
Nov, 2019
本研究提出了一种基于全序列级别的特征聚合方法(SELSA),用于视频目标检测,实现了更具区分性和更健壮的特征,同时创造了新的视角来理解 VID 问题。此法不需要 Seq-NMS 或 Tubelet 重评分等复杂的后处理方法,保持了管道的简洁明了,并在 ImageNet VID 和 EPIC KITCHENS 数据集上实现了新的最先进结果。
Jul, 2019
该研究提出了一种针对视频识别的研究框架,Deep feature flow,使用卷积神经网络在关键帧上运行,通过流场传播其特征图到其他帧,大大提高了视频识别的速度和准确性,同时为实际应用打下坚实的基础。
Nov, 2016
本文提出了一种轻量级的视频物体检测网络,采用稀疏关键帧上的轻量级图像物体探测器进行检测,并在关键帧上应用基于流量引导的 GRU 模块,对特征进行有效聚合。对于非关键帧,进行稀疏特征传播。该系统在移动设备上运行速度较快,在 HuaWei Mate 8 上可达到 60.2%的 mAP 得分以及 25.6 fps 的速度。
Apr, 2018
本文介绍了一种新的基于流的视频补全算法,采用提取与补全运动边缘,引入非局部流连接到时间上远离的帧中,来解决运动边界障碍问题,通过在 DAVIS 数据集上的实验证明其优于现有算法。
Sep, 2020
本文提出了一种端到端可训练网络 SegFlow,用于同时预测视频中逐像素对象分割和光流,并通过统一框架双向传播对象分割和光流的有用信息。实验证明,引入光流可提高分割性能,同时改善了最先进算法的结果。
Sep, 2017
本研究利用网络上自动采集的视频,通过使用时域信息可以识别目标对象的更大区域,从而产生与标记相似的结果,该方法在验证集上超过了现有标准,并使结果达到了最新的水平。
Aug, 2019
本文提出了一种新的适应性框架来捕捉从空间和时间线索中提取出的可用信息,其中包括 CAG 模块和 DDE 模块,并在四个广泛使用的数据集上进行了实验证明其相对于 13 种最先进方法的有效性。
May, 2021