最近,视频对象分割(VOS)网络通常使用基于记忆的方法:对于每个查询帧,通过空间 - 时间匹配预测掩码以与记忆帧相匹配。尽管这些方法具有卓越的性能,但存在两个问题:1)具有挑战性的数据可以破坏相邻视频帧之间的空间 - 时间一致性。2)像素级匹配会由噪音或干扰引起不希望的不匹配。为解决上述问题,我们首先提出在相邻帧之间生成一个辅助帧,作为查询帧的隐式短时间参考。随后,我们为每个视频对象学习一个原型,并在查询帧和记忆帧之间实施原型级匹配。实验证明,在 DAVIS 2017 上我们的网络优于最先进的方法,达到了 86.4% 的 J&F 分数,并且在 YouTube VOS 2018 上获得了 85.0% 的竞争结果。此外,我们的网络的推理速度为 32+ FPS。
May, 2024
该研究论文提出了一种局部匹配的解决方案,即区域性记忆网络(RMNet),用于半监督视频对象分割技术,旨在消除空间 - 时间记忆网络中的全局匹配误差并提高计算效率。实验表明, RMNet 在 DAVIS 和 YouTube-VOS 数据集上的表现优于现有的技术。
Mar, 2021
本研究提出了一种基于对空间 - 时间对应匹配的显式监督学习的视频物体分割方法,该方法可以在不增加额外训练成本、没有速度延迟和不需要架构修改的情况下提高目前最先进的匹配式 VOS 方法的性能。
Apr, 2023
本文提出了一种端到端的网络来解决视频对象分割中时间建模的根本挑战,包括短期记忆子网络和长期记忆子网络,通过图形学习框架提高局部区域间的可视一致性,在三个常用的数据集上取得了非常好的性能。
Mar, 2020
该研究提出 REMN,一种稳健高效的记忆网络,用于半监督视频物体分割,通过引入本地注意机制和动态记忆库,解决了非局部匹配和高时间冗余的问题,实验表明 REMN 在 DAVIS 2017 和 YouTube-VOS 2018 上均取得最新的成果,具有较高的推理速度和相对较少的计算资源。
该论文介绍了一种简单而有效的方法来建模视频对象分割中的时空对应关系,使用对应关系实现内存高效且鲁棒的框架,并且使用负平方欧氏距离计算亲和力,实现了多对象的高速分割,并获得了最新的最高性能结果。
Jun, 2021
该研究提出了一种空间 - 时间多层次关联框架,以解决现有半监督视频对象分割方法在空间特征匹配和时空特征建模方面的限制,并通过空间 - 时间记忆库实现充分的目标交互和高效的并行处理,从而提高视频对象分割的效果。
Apr, 2024
该研究提出了一种新型的时空图神经网络(STG-Net)方法,它通过利用所有 Object Proposals 并捕捉它们之间的关联来更精确地重建视频对象分割的遮罩,并通过滑动窗口方法以及记忆模型来捕捉时态相关信息。该方法在四个大型数据集上实现了最新的表现,并展示了其有效性。
Dec, 2020
通过将对象特征汇总成为动态查询,并将其作为动态滤波器用于掩膜预测,我们提出了一种名为 QMVOS 的查询调节方法,从而为模型提供高级描述和对象级感知。通过查询间的注意力实现高效有效的多对象交互,这一方法对基于内存的半监督视频对象分割方法带来了显著的改进,并在标准 SVOS 基准上实现了竞争性能。
Mar, 2024
本文提出了一种基于片段的推理方案,用于半监督视频分割,得到了最先进的表现,包括准确性和效率收益,通过夹杂在一段时间内进行两次推断和显式改进内部特性的片段操作,以及在片段内部推广匹配机制等模块的协同作用。
Aug, 2022