Sep, 2024

神经音频编解码中的源解耦学习

TL;DR本研究解决了现有神经音频编解码模型在处理不同音频域(如语音、音乐和环境声音)时的不足。提出的源解耦神经音频编解码器(SD-Codec)通过联合学习音频重合成和源分离,将不同域的音频信号明确地分配到不同的代码库中。实验结果表明,SD-Codec在保持竞争性的重合成质量的同时,成功实现了潜在空间中不同源的解耦,从而提升了音频编解码的可解释性,并提供了更细致的音频生成控制能力。