Feb, 2024

推动大型语言模型在口语对话中捕捉多样的言谈风格并作出恰当回应

TL;DR在口语对话中,即使两个当前对话相同,它们的回应在不同的语言风格中可能仍然不同。这篇论文提出了一种 Spoken-LLM 框架,旨在教导 LLMs 理解和适当回应不同的语言风格,并使用 StyleTalk 数据集进行训练,通过两个阶段的训练使 Spoken-LLM 更好地学习语言风格,实验证明 Spoken-LLM 表现优于纯文本基准和先前的语音 LLMs 方法。