Feb, 2024

零封装的基于流匹配的文本转语音使你尽情大笑

TL;DR提出了基于短音频提示的 ELaTE 零样本文本到语音模型,能够以精确的笑声控制时间和表达来生成任何说话者的自然笑声,比传统模型具有更高质量和可控性。