BriefGPT.xyz
Ask
alpha
关键词
video-to-audio generation
搜索结果 - 2
Action2Sound: 环境感知的从自我为中心视频生成行动声音
提出了一种新颖的环境感知音频生成模型,用于根据视频内容生成符合语义和时间要求的音频;使用了特殊的音频条件机制,以在野外训练视频中学习将前景动作声音与环境背景声音解耦合。
PDF
23 days ago
Frieren: 用修正流匹配的方法高效生成视频到音频
基于修正的流匹配,我们提出了 Frieren—— 一个视频到音频(V2A)生成模型,通过回归从噪声到频谱图的条件传输向量场来合成与内容匹配的音频,以高品质、高效率和视听时序同步性建立 V2A 模型依然具有挑战性。通过利用基于前馈变换器的非自
→
PDF
a month ago
Prev
Next