Jul, 2024

Qwen2-Audio 技术报告

TL;DRQwen2-Audio是一个大规模音频语言模型,它能够接收各种音频信号输入,并根据语音指令进行音频分析或直接文本回复。它具有较强的指令跟随能力,实现了语音聊天和音频分析两种交互模式,优化了模型的性能,目的是促进多模态语言研究的发展。