May, 2023

使用大型语言模型控制说话风格以实现表情丰富的 TTS

TL;DR本研究旨在使用生成型语言模型与 TTS 模型,提供合适的发音特征,以更好地表达不同的说话风格和对话语境,从而提升语音合成的表现。