May, 2024

高斯流桥在非配对数据下的音频域转换

TL;DR研究发现,利用高斯流桥,一种新兴的生成建模方法,实现音频领域转移的潜力,通过一系列确定性概率流处理不同分布的音频信号传输问题。该方法通过连续控制变量来改变目标分布的属性,实现目标域的特性操作,而且无需依赖配对样本训练。通过将基于块的小批量合适传统方法与噪声结合,以保持语音内容的一致性,我们提出了一种训练策略。在混响和失真操作任务中,我们的无监督方法与其他基准方法相比具有竞争性能。尽管存在一些限制,但本研究的有趣结果表明了进一步研究的潜力。