Sep, 2023

空时中的乘法残差哈希神经视频分解

TL;DR我们提出了一种视频分解方法,可以对具有时空变化照明和运动效果的视频进行基于层次的编辑。我们的神经模型将输入视频分解为多个分层表示,其中包括2D纹理贴图、原始视频的掩码以及表征光照条件时空变化的乘法残差。通过对纹理贴图进行单个编辑,可以在整个视频帧的对应位置传播并保持其他内容的一致性。通过坐标哈希,我们的方法可以以每帧25秒的速度高效学习1080p视频的基于层次的神经表示,并在单个GPU上以71帧每秒的速度实时渲染编辑结果。在定性方面,我们运行该方法在各种视频上展示其生成高质量编辑效果的有效性。在定量方面,我们提出采用特征跟踪评估指标来客观评估视频编辑的一致性。