May, 2023

SpeechGPT:赋能大型语言模型具备内在的跨模态对话能力

TL;DR本文提出了 SpeechGPT,一个具有内在跨模式对话能力的大型语言模型,可以感知和生成多模式内容,并演示了语音 + 文本的多模态交互示例。