Nov, 2024
SALMONN-omni:无编码器全双工语音理解与生成模型
SALMONN-omni: A Codec-free LLM for Full-duplex Speech Understanding and
Generation
TL;DR本研究解决了传统对话AI系统中的组件分离问题,提出了一种新颖的无编码器全双工语音理解与生成框架SALMONN-omni。该模型能够同时理解生成的语音及背景声音,展示了在语音识别、语音增强等任务上的卓越性能,以及在对话时的自然交互能力,预计将推动全双工对话AI系统的发展。