Feb, 2024
零封装的基于流匹配的文本转语音使你尽情大笑
Making Flow-Matching-Based Zero-Shot Text-to-Speech Laugh as You Like
Naoyuki Kanda, Xiaofei Wang, Sefik Emre Eskimez, Manthan Thakker, Hemin Yang...
TL;DR提出了基于短音频提示的 ELaTE 零样本文本到语音模型,能够以精确的笑声控制时间和表达来生成任何说话者的自然笑声,比传统模型具有更高质量和可控性。