Apr, 2025

自动风格TTS:基于检索增强生成的自动风格匹配文本到语音合成

TL;DR本研究针对以往文本到语音合成研究中忽视提示选择的重要性,提出了一种基于检索增强生成(RAG)的TTS框架。该框架能够根据文本内容动态调整语言风格,从而实现更自然生动的交流效果,并通过构建高质量语音样本知识库和风格匹配方案,验证了其有效性。