运动背叛:通过运动分割发现伪装的物体
本文针对计算机视觉中的新颖而具有挑战性的课题 —— 伪装物体的检测和分割,提出了一种新的 few-shot learning 方法,包括构建 CAMO-FS 数据集、提出实例三元组损失和实例内存存储等,最终在新构建的数据集上实现了业内最佳的检测和分割性能。
Apr, 2023
提出了一种新的视频伪装目标检测 (VCOD) 框架,可以利用短期动态和长期时间一致性来检测视频帧中的伪装目标,采用单一优化框架统一了运动估计和对象分割,并使用空间 - 时间变换器从而有效地处理视频的时间动态,提供了一个名为 MoCA-Mask 的大规模 VCOD 数据集,为该方向的研究建立了综合性的基准测试。
Mar, 2022
本研究介绍了一种基于运动线索的分割方法,使用 Transformer 网络结构,采用自我监督的方法进行训练,结果在公共基准测试中表现优异,证明在现有视频分割模型中,对于运动线索的重要性,以及对视觉外观存在潜在偏差的可能性。
Apr, 2021
本研究基于第一原理推导出新的似然函数,使用角度和光流大小的新组合来最大化关于物体真实运动的信息,开发了一种运动分割算法,比当前最先进的方法提高了很大的准确率,并在两个已建立的基准测试和一个新的伪装动物数据集上进行了对比。
Apr, 2016
本文提出了一种基于人眼视觉感知的三阶段模型,它可以在单次迭代中进行粗到细的分割,并采用了多尺度特征增强和边界增强模块。此外,还使用了掩码引导并结合了粗略预测图与高分辨率特征图来生成细致的结果。我们的网络表现优于现有 CNN 模型,降低了计算开销并减轻了背景噪声干扰。
May, 2023
本文提出了一种基于神经网络的视频分割方法,用于区分视频帧中独立运动的物体,并利用对象运动、外观和时间一致性等多个信息源,通过对数据进行训练得到模型,经过评估表明该模型在 DAVIS、Freiburg-Berkeley 运动分割数据集和 SegTrack 等数据集上表现良好。
Dec, 2017
本文针对对象发现这一问题,通过选择动态对象并使用自编码器提取图像特征并加入来自运动分割的弱学习信号,成功地从复杂场景中分离出运动和静止的动态对象,相较于其它抽象特征的方法在 KITTI 数据集上有更好的表现。
Mar, 2022
本文提出一种基于像素几何和物体运动模型的运动预测方法,通过将图像分为运动一致的区域并利用深度构建最佳匹配的流场基础来减少从单个图像重建流场的不确定性,并在场景结构和物体运动建模方面取得了最新的结果,同时对预测深度图的评估显示出可靠的单眼深度估计性能。
Jul, 2023
提出了一种背景感知的运动引导对象发现方法,通过利用光流提取的运动对象的遮罩并设计学习机制将其扩展到由移动和静止对象组成的真实前景,并在对象发现过程中隔离背景,从而实现对象发现任务和对象 / 非对象分离的联合学习,为对象发现性能和对象 / 非对象分离建立了强有力的基线。
Nov, 2023