Feb, 2024

Daisy-TTS: 通过韵律嵌入分解模拟更广泛情感频谱

TL;DR在这篇论文中,我们提出了一种基于结构模型的情感文本转语音设计,旨在模拟更广泛的情感谱系。我们的设计 Daisy-TTS 中加入了韵律编码器,以学习具有情感可分离性的韵律嵌入作为情感的代理。通过一系列的感知评估,与基准相比,Daisy-TTS 展示了更高的情感语音自然度和情感可感知性。