May, 2023

PandaGPT:一种模型以指导全为本

TL;DRPandaGPT 是一个使用视觉和听觉指令的方法来提高大型语言模型的能力,可以同时接收多模态输入并进行自然的语言生成,它能够执行任务如生成详细的图像描述和根据视频撰写故事等,并能连接图像 / 视频中物体的外观和音频中物体的声音,从而表现出跨模态的行为。