Oct, 2023

非刚性文本提示的音频编辑

TL;DR通过非刚性文本编辑探索音频编辑,我们展示了所提出的编辑流程能够创建与输入音频保持一致的音频编辑结果。我们研究了能够执行加法、风格转移和修复的文本提示,并在定量和定性上展示了这些编辑结果优于最近发布的文本提示音频生成模型 Audio-LDM。通过对结果的定性检查,我们发现我们的方法给出的编辑结果在保持音频事件的原始起始点和结束点方面更为忠实。