Jan, 2025
JELLY: 结合情感识别与上下文推理的大型语言模型对话语音合成
JELLY: Joint Emotion Recognition and Context Reasoning with LLMs for
Conversational Speech Synthesis
TL;DR本研究解决了对话语音合成中缺乏对话上下文和情感识别的问题。提出的JELLY框架通过集成情感识别和上下文推理,利用多个部分LoRA模块对大型语言模型进行微调,以生成合适的对话语音。实验结果表明,JELLY在情感上下文建模方面表现出色,能够自然地生成符合对话情感的语音。