- D$^2$NeRF: 自监督解耦单目视频中的动态和静态物体
本文介绍了一种自我监督的方法 D^2NeRF,可以基于单目视频学习 3D 场景,分离动态物体与静态背景,实现影子的分离与消除,并在各种场景下获得较好的效果。
- CVPR非监督视频分解的可变形精灵
本文提出了一种从动态场景中提取持久元素的方法,采用 Deformable Sprite 作为场景元素的表示,实现了一些应用如一致的视频编辑。Deformable Sprites 是一种视频自编码模型,它是针对单个视频进行优化的,不需要大规模 - 跟踪、检查、重复:一种基于 EM 算法的无监督跟踪方法
该研究提出了一种用于在没有标签的 RGB-D 视频中检测和跟踪移动物体的无监督方法,该方法通过手工制作的技术来估计光流和摄像机运动,构建移动对象的类别集合并提高检测性能。
- CVPRMonoRec:单目移动相机在动态环境中的半监督稠密重建
本文提出了 MonoRec,一种半监督单目稠密重建架构,可以在动态环境下从单个运动相机中预测深度地图。MonoRec 基于多视图立体设置,通过成本体积编码多个连续图像的信息。为了处理场景中的动态物体,我们引入了 MaskModule,通过利 - CVPR利用物体运动预测实现未来视频合成
利用背景场景和移动物体的非刚性变形和仿射变换对未来视频帧进行预测,实现较低的变形失真,并在 Cityscapes 和 KITTI 数据集上呈现更高的视觉质量和准确性。
- ICCVTASED-Net: 用于视频显著性检测的时间聚合空间编码解码网络
TASED-Net 是一种用于视频显着性检测的三维全卷积神经网络结构,采用编码器 - 解码器结构,能够在考虑有限数量过去帧的情况下,对与运动目标相关的显着帧进行有效预测。大量实验结果表明该模型明显优于之前的方法,并且特别擅长关注显著的运动物 - 实际应用中的背景减除:挑战、现有模型和未来方向
本文详细调研了现实应用中使用的背景减除的真实挑战,现有的背景模型并提供了未来的研究方向。
- 利用点相关性在动态环境中进行 RGB-D SLAM
本文提出了一种同时定位与地图构建方法,能够在动态环境下消除移动物体的影响,该方法利用地图点之间的相关性将静态场景点与移动物体点分组,并依此进行运动估计,实验证明该方法能在动态环境下保证鲁棒和准确性。
- GOT-10k: 野外通用物体追踪的大规模高多样化基准
本文介绍了一个基于 WordNet 结构的大型跟踪数据库,名为 GOT-10k。GOT-10k 可以提供超过 10,000 个视频段,1.5 百万个手动标记的边界框,由此可以进行深度跟踪的统一训练和稳定评估。此外,该数据库还引入了一种名为 - 深度强化学习的无监督视频对象分割
本文提出了一种深度强化学习技术,自动检测运动物体并利用相关信息进行动作选择;该技术通过结构运动利用无监督学习检测运动物体,将代理学习到的表示用于聚焦移动物体的决策,并在 Atari 游戏领域得到了实证验证,拥有更好的可解释性。
- 学习移动物体的分割
本文提出了一种基于神经网络的视频分割方法,用于区分视频帧中独立运动的物体,并利用对象运动、外观和时间一致性等多个信息源,通过对数据进行训练得到模型,经过评估表明该模型在 DAVIS、Freiburg-Berkeley 运动分割数据集和 Se - CVPR大部分为刚体场景下的光流
文章提出了一种综合了静态和非约束场景下光流方法的算法,可以同时估计运动物体的分割和相机运动的 3D 结构,具有更高的精度。
- 全局与局部稀疏子空间优化的运动分割
本文提出了一种基于仿射子空间模型的特征运动物体分割新框架,该方法通过稀疏 PCA 表示原始轨迹,通过自动搜索最近邻点的稀疏表达来实现局部子空间分离,并提出了一种误差估计来处理缺失数据问题,最后通过谱聚类方法将不同的运动分割出来,实验证明该方 - 复杂场景视频修复
这篇论文提出了一种基于全局、基于补丁的功能的自动视频修复算法,可以处理动态纹理、多个移动对象和移动背景等挑战情况,并在执行时间方面比现有技术快一个数量级。最终的算法不需要分割或手动输入,只需要定义修复遮罩即可,并且能够处理比以前的工作更广泛 - 视频序列中的图像分割:概率方法
本文通过使用混合高斯模型和无监督的 EM 算法,提出了一种基于像素分类的背景减法方法,并应用于交通监控中,取得了较好的车辆识别和跟踪效果。