Sep, 2024

基于大语言模型的合成音频对话生成框架

TL;DR本研究解决了在多角色设置下生成高质量合成对话音频的问题。提出的ConversaSynth框架有效生成多样且连贯的文本对话,并通过语音合成技术将其转化为音频。实验结果显示,生成的合成数据集具有显著的多样性和真实感,能够显著提升音频标记、分类及多讲者语音识别模型的训练和评估。