Mar, 2024

WavLLM:面向健壮和适应性语音大语言模型的研究

TL;DRWavLLM 是一种鲁棒且自适应的具有双编码器和提示感知的语音大型语言模型,通过两阶段课程学习方法来优化,以在各种语境下进行听觉任务的泛化和执行复杂任务。