基于传播方法的视频目标分割的实证研究
本文提出了一种基于深度学习的交互式视频对象分割方法,通过卷积神经网络进行交互和传播两个核心操作,并通过新的多轮训练方案,使网络能够学习如何理解用户的意图和更新不正确的估计,实现高质量和快速的分割,并在 DAVIS 挑战赛上跑得更快、更准确,实现了真实用户交互。
Apr, 2019
本文提出了基于光流和边缘线索的新型显着性估计技术和新型邻域图,用于解决快速运动,运动模糊和遮挡等视频分割的挑战,在 DAVIS,SegTrack v2 和 FBMS-59 数据集中取得了超越深度学习方法的最新成果。
Sep, 2018
通过视频预测方法合成新的训练样本并引入边界标签松弛技术,使模型对标注噪声和传播伪影更加鲁棒,实现在 Cityscapes 数据集上 83.5%、CamVid 上 82.9% 的 mIoUs 并在 KITTI 语义分割测试集上取得 72.8% 的 mIoU,超过 ROB 挑战 2018 年的获奖模型。
Dec, 2018
本篇论文提出了一种名为 QueryProp 的视频物体检测特征传播框架,通过对象级特征传播策略和自适应传播门进行关键帧选择,实现了高准确率和高速度的检测。
Jul, 2022
本研究提出了一种使用深度循环网络实现同时分割和追踪视频中物体的方法,结合了时间传播和重新识别模块,以及基于注意力的循环蒙版传播方法,取得了在 DAVIS 2017 基准测试(test-dev 集合)上最高的分割和边缘测量平均值(68.2),优于同一分区上获胜解决方案的全球平均值(66.1)
Mar, 2018
本研究提出一种具有高可靠性的纠错机制,包括对目标帧嵌入进行稳健的信道重校准,引入可靠引用补充 “根据局部时间相关性和可靠参考” 两种调节器,采用级联纠正方案,用于在线半监督视频对象分割中抑制误差传播,并通过在可靠性过滤器中检索可靠补丁,将参考线索增强,最终,在 YouTube-VOS18/19 和 DAVIS17-Val/Test 基准上实现最先进的性能表现。
Dec, 2021
通过结合基于类别的目标检测、类别独立的目标外观分割和时间上的目标追踪等方法,通过训练全卷积网络对视频中的特定对象外观进行独立的分割,再引入对检测框时间上的连续性约束,从而实现半监督视频目标分割。
Jul, 2017
本篇论文提出了一种基于标签传播和特征相似性的转导方法,用于半监督视频目标分割,其中考虑了长期目标出现特征。该方法无需额外的模块、数据集或架构设计,使用普通的 ResNet50 作为主干,在 DAVIS 2017 评估集上达到了 72.3 的分数,有着高性能和高效率的优点。
Apr, 2020
本文提出了一种基于深度学习的实例级对象分割框架,其中包括使用 ResNet-101 进行前景 / 背景分割的通用模型训练,基于该通用模型接受带标注对象的训练数据,通过迭代学习实例级模型的方法以及使用空间传播网络和滤波器对分割结果进行进一步优化,以实现不同视频中的实例级对象分割。
Sep, 2017