ICLRFeb, 2024

通过受控合成学习解耦的音频表征

TL;DR本文解决了解缠音频表示学习中基准数据的稀缺问题。我们介绍了 SynTone,这是一个合成数据集,具有明确的基准解释因素,用于评估解缠技术。在 SynTone 上评估最先进的方法展示了它在方法评估中的实用性。我们的结果强调了音频解缠的优势和局限性,推动了未来的研究。