Aug, 2024

语言模型可以边说边听

TL;DR本研究解决了传统语音模型在实时对话中无法进行双向交互的问题,提出了一种名为边说边听语言模型(LSLM)的新型设计,可以同时进行听和说的操作。研究表明,通过中间融合策略,LSLM在噪声环境中表现出色,能够显著提升人机交互的自然性与灵活性,为语音对话系统的发展提供了新的方向。