ROAM: 基于丰富对象外观模型的轮廓线动画应用
本文提出了一种基于响应生成和边界框回归的跟踪模型,利用尺寸可调卷积滤波器适应对象的形状变化,同时利用离线训练的循环神经优化器在元学习环境中更新跟踪模型,从而提高更新速度并实现更好的性能。实验证明该方法在多项基准测试中表现优异。
Jul, 2019
通过引入外观优化方法和视频流的时间一致性,我们提出了一种能够独立发现、分割和跟踪复杂视觉场景中独立移动物体的方法。该方法通过简单的选择机制识别准确的光流预测掩码,并基于示例信息优化有问题的掩码。我们的模型在多个视频分割基准上的性能表现验证了其在单个物体分割上的竞争力,并在更具挑战性的多物体分割问题上明显优于现有模型。最后,我们研究了将我们的模型用作逐帧 Segment Anything 模型的提示的好处。
Dec, 2023
介绍了一种名为 Lester 的新方法,可以从视频中自动合成复古风格的 2D 动画,主要将这个挑战视为对象分割和跟踪问题,并通过使用 Segment Anything Model (SAM) 对视频帧进行处理,并使用 DeAOT 对生成的掩码进行后续帧的跟踪,最后使用 Douglas-Peucker 算法简化掩码的轮廓,该方法在时间上表现得很一致,并能正确处理不同姿势、外观、动态镜头、部分镜头和多样背景的视频。
Feb, 2024
本研究提出了一种基于 RoPS 和 LRF 的 3D 物体识别算法,通过计算散布矩阵和投影统计学方法对邻域进行特征描述,从而实现对噪声和网格分辨率的鲁棒性,取得了比现有技术更好的表现。
Apr, 2013
ROCA 是一种新颖的端到端方法,用于从形状数据库中获取和对齐 3D CAD 模型到一幅输入图像,从而实现对 2D RGB 观察场景的 3D 感知,该方法基于密集的二维 - 三维物体对应和 Procrustes 对齐的可微对齐优化,同时通过利用 2D-3D 对应来学习几何相似的 CAD 模型,从而为 CAD 检索提供稳健的对齐结果。实验结果表明,在来自 ScanNet 的具有挑战性的实际图像中,ROCA 显著提高了检索感知 CAD 对齐精度,从 9.5% 提高到 17.6%。
Dec, 2021
提出了一种模块化网络,利用几何分析独立对象运动能从码流场中恢复,利用 3D 刚体转换对背景和多个刚体运动物体进行分割掩模并获得刚性运动分割的最佳性能,从而显着改善深度和场景流估计。
Jan, 2021
视频模态分割是计算机视觉中一个具有挑战性的任务,本文提出了一种基于对象中心表示的高效模态分割方法,利用运动流和多视图信息相互融合,引入三维信息以提升特征质量,并通过对象插槽和注意机制完成充分的对象表示,实现对物体的全遮罩分割。
Sep, 2023
本研究提出了一种基于深度学习的模型,用于估计连续 RGB-D 图像之间的场景流,可以将场景分成多个刚体运动的对象,利用编码和解码阶段,得到了像素级目标中心、运动和旋转估计,并在大规模合成和真实数据集上测试了模型性能。
Apr, 2018
该研究提出了一种基于循环神经网络的视频多目标分割模型,实现了零样本学习和时间上的目标连贯性,此模型在 DAVIS-2017 和 YouTube-VOS 基准测试上取得了优异的表现,并且其推理时间比现有方法更快。
Mar, 2019