ROAM: 基于丰富对象外观模型的轮廓线动画应用

Dec, 2016

ROAM: 基于丰富对象外观模型的轮廓线动画应用

ROAM: a Rich Object Appearance Model with Application to Rotoscoping

Ondrej Miksik, Juan-Manuel Pérez-Rúa, Philip H. S. Torr, Patrick Pérez

TL;DR提出一种结合局部和全局外观模型以及特征标记的新框架，来捕捉和跟踪视频中任意物体的外观，以实现基于参数曲线的 Rotoscoping。

Abstract

rotoscoping, the detailed delineation of scene elements through a video shot, is a painstaking task of tremendous importance in professional post-production pipelines. While pixel-wise segmentation techniques can help for this task, professional →

rotoscoping parametric curves visual tracking appearance model iteration

发现论文，激发创造

ROAM: 循环优化跟踪模型

本文提出了一种基于响应生成和边界框回归的跟踪模型，利用尺寸可调卷积滤波器适应对象的形状变化，同时利用离线训练的循环神经优化器在元学习环境中更新跟踪模型，从而提高更新速度并实现更好的性能。实验证明该方法在多项基准测试中表现优异。

Jul, 2019

基于外貌的目标中心运动分割优化

通过引入外观优化方法和视频流的时间一致性，我们提出了一种能够独立发现、分割和跟踪复杂视觉场景中独立移动物体的方法。该方法通过简单的选择机制识别准确的光流预测掩码，并基于示例信息优化有问题的掩码。我们的模型在多个视频分割基准上的性能表现验证了其在单个物体分割上的竞争力，并在更具挑战性的多物体分割问题上明显优于现有模型。最后，我们研究了将我们的模型用作逐帧 Segment Anything 模型的提示的好处。

Dec, 2023

通过视频物体分割和跟踪的蒙版动画

介绍了一种名为 Lester 的新方法，可以从视频中自动合成复古风格的 2D 动画，主要将这个挑战视为对象分割和跟踪问题，并通过使用 Segment Anything Model (SAM) 对视频帧进行处理，并使用 DeAOT 对生成的掩码进行后续帧的跟踪，最后使用 Douglas-Peucker 算法简化掩码的轮廓，该方法在时间上表现得很一致，并能正确处理不同姿势、外观、动态镜头、部分镜头和多样背景的视频。

Feb, 2024

旋转投影统计量用于三维局部表面描述和物体识别

本研究提出了一种基于 RoPS 和 LRF 的 3D 物体识别算法，通过计算散布矩阵和投影统计学方法对邻域进行特征描述，从而实现对噪声和网格分辨率的鲁棒性，取得了比现有技术更好的表现。

Apr, 2013

ROCA：单图像下的强鲁棒性 CAD 模型检索和对齐

ROCA 是一种新颖的端到端方法，用于从形状数据库中获取和对齐 3D CAD 模型到一幅输入图像，从而实现对 2D RGB 观察场景的 3D 感知，该方法基于密集的二维 - 三维物体对应和 Procrustes 对齐的可微对齐优化，同时通过利用 2D-3D 对应来学习几何相似的 CAD 模型，从而为 CAD 检索提供稳健的对齐结果。实验结果表明，在来自 ScanNet 的具有挑战性的实际图像中，ROCA 显著提高了检索感知 CAD 对齐精度，从 9.5% 提高到 17.6%。

Dec, 2021

从两帧图像学习刚体运动分割

提出了一种模块化网络，利用几何分析独立对象运动能从码流场中恢复，利用 3D 刚体转换对背景和多个刚体运动物体进行分割掩模并获得刚性运动分割的最佳性能，从而显着改善深度和场景流估计。

Jan, 2021

重新思考从学习有监督信号与以对象为中心的表示进行的非物质视频分割

视频模态分割是计算机视觉中一个具有挑战性的任务，本文提出了一种基于对象中心表示的高效模态分割方法，利用运动流和多视图信息相互融合，引入三维信息以提升特征质量，并通过对象插槽和注意机制完成充分的对象表示，实现对物体的全遮罩分割。

Sep, 2023

RoSI：从少量关节图像中恢复三维形状内部

该研究提出了一种 RoSI 学习框架，通过多视角和多关节图像从外部恢复 3D 模型的内部结构，并在实验中证实了该方法的泛化能力。

Apr, 2023

基于密集 RGB-D 场景流的基于运动的物体分割

本研究提出了一种基于深度学习的模型，用于估计连续 RGB-D 图像之间的场景流，可以将场景分成多个刚体运动的对象，利用编码和解码阶段，得到了像素级目标中心、运动和旋转估计，并在大规模合成和真实数据集上测试了模型性能。

Apr, 2018

RVOS：端到端的循环神经网络用于视频对象分割

该研究提出了一种基于循环神经网络的视频多目标分割模型，实现了零样本学习和时间上的目标连贯性，此模型在 DAVIS-2017 和 YouTube-VOS 基准测试上取得了优异的表现，并且其推理时间比现有方法更快。

Mar, 2019