Jun, 2024

改进跨文本韵律转换的人机交互方法

TL;DR通过使用人工调整显著的韵律相关因素,使得生成语音更适合目标文本,同时保持整体参考音调效果,可以提高跨文本韵律转换模型的感知自然度约 57.8%,分析结果显示,有限的用户努力就足够实现这些改进,并且潜在的参考空间接近性不是可靠的跨文本韵律相似度度量。