Jun, 2023
StyleTTS 2:通过样式扩散和大型语音语言模型的对抗训练实现人类水平的文本朗读
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models
Yinghao Aaron Li, Cong Han, Vinay S. Raghavan, Gavin Mischler, Nima Mesgarani
TL;DR本文提出了 StyleTTS2,它是一个使用了样式扩散和对抗训练技术以及大型语音语言模型的文本转语音模型,它能够有效地进行潜在扩散,实现单个和多个说话人的人类级 TTS 合成。