Apr, 2024

AudioScenic:音频驱动的视频场景编辑

TL;DR通过音频信号调整视觉背景,保持前景内容不变,本文介绍了 AudioScenic,一个用于视频场景编辑的音频驱动框架。通过时间感知的音频语义注入过程将音频语义整合到视觉场景中,同时引入 SceneMasker 模块来在编辑过程中保持前景内容的完整性,利用音频信号的特性来控制时间动态并增强时间一致性,从而达到增强视觉多样性和维护视频整体时间一致性的目的。