Jun, 2022

从离散语音表示合成个性化非语音声化

TL;DR本文研究了非语言声音(NSV)建模作为文本转语音任务的可行性,评估了 HUBERT 语音单元在 NSVs 上的语音表现力和模型控制扩展演讲者音色的能力,还探讨了实现 NSV 建模的障碍,提出了五种未来研究改进方法。