基于动态指引的视频显著目标检测注意力模型
本文提出了一个深度学习模型,通过数据增强技术和动态显著性模型来高效地检测视频中的显著区域,该模型在 DAVIS 和 FBMS 数据集上达到了最新的性能标准。
Feb, 2017
本文提出了基于光流和边缘线索的新型显着性估计技术和新型邻域图,用于解决快速运动,运动模糊和遮挡等视频分割的挑战,在 DAVIS,SegTrack v2 和 FBMS-59 数据集中取得了超越深度学习方法的最新成果。
Sep, 2018
本文研究了用于视频显著对象检测的最近引入的非局部神经网络方法,并应用于 static 和 dynamic 显著性检测,提出了一种新的深度非局部神经网络架构,测试了 DAVIS 和 FBMS 两个著名数据集,实验结果表明该算法优于最先进的视频显著性检测方法。
Oct, 2018
本文提出了基于新型弱标注的视频显著目标检测模型,并使用外观运动融合模块和双向 ConvLSTM 框架来实现有效的多模态学习和长期时序建模,还设计了一种前景背景相似度损失和一种弱标注增强策略,以提高模型性能和伪标签生成技术。在六个基准视频显著性检测数据集上的实验结果证明了我们方案的有效性。
Apr, 2021
本论文提出了一种基于半监督学习的视频显著性目标检测方法,使用伪标签从稀疏注释帧中生成像素级伪标签,并结合部分手动注释,学习了空间和时间线索,进而产生准确的显著性图。实验结果表明,我们的方法在 VOS、DAVIS 和 FBMS 三个公共基准测试数据集上均明显优于所有最先进的全监督方法。
Aug, 2019
本文介绍了一种基于 DNN 预测视觉显著性的方法,提出了一种基于对象到动作 CNN 的空时特征学习,实现了视频帧内显著性预测和跨帧显著性转移的 2C-LSTM 网络,并表明该方法在视频显著性预测方面领先于其他方法。
Sep, 2017
本文提出了一种新的适应性框架来捕捉从空间和时间线索中提取出的可用信息,其中包括 CAG 模块和 DDE 模块,并在四个广泛使用的数据集上进行了实验证明其相对于 13 种最先进方法的有效性。
May, 2021
本研究旨在通过多任务学习方式训练一个网络实现视觉注意力,使用半监督学习方式生成前 / 背景分割标签,进而训练目标检测模型,利用分割地图实现自我注意机制,获得在交通监控领域两个数据集上显著的 mAP 改进,UA-DETRAC 和 UAVDT 数据集上均实现了最先进的结果。
Feb, 2020
通过引入 Inter-Layer Attention 模块、Inter-Layer weight 模块和 Bi-Modal Attention 模块,本研究提出了一种 Spatial-Temporal Dual-Mode Mixed Flow 网络(STDMMF-Net),该网络利用全景视频的空间流和对应的光流来实现显著目标检测。实验证明,与最先进的方法相比,该方法在检测准确性、模型推理所需内存、测试时间、复杂性和泛化能力等方面表现更好。
Oct, 2023