Aug, 2024

呈现:零样本文本到韵律的控制

TL;DR本研究解决了当前语音合成中细粒度韵律控制的不足,提出了一种名为PRESENT的方法,能够在不需新的训练或样式嵌入的情况下实现韵律编辑。研究表明,该方法在零样本语言转移中表现优异,对德语、匈牙利语和西班牙的字典错误率显著改善,且实现了亚音素级别的控制,首次应用于基于快语音2的模型。