May, 2023

通过将多模态视为外语来引导先进的大型语言模型

TL;DR本文提出了一种名为 X-LLM 的多模态语言模型,它将多种形式的信息转化为语言输入到 ChatGLM 中进行处理,实现了语言模型的多模态能力,具有与 GPT-4 相当的人工智能水平,同时还能用于语音识别和多模态语音识别。