Sep, 2023
多轮交替多模态指令跟随
TextBind: Multi-turn Interleaved Multimodal Instruction-following
Huayang Li, Siheng Li, Deng Cai, Longyue Wang, Lemao Liu...
TL;DR介绍了 TextBind,这是一个几乎无需标注的框架,可以为较大的语言模型赋予多轮交错的多模态指令跟随能力,通过仅使用图像 - 标题对生成多轮多模态指令 - 回应对话,从而旨在推动多模态指令跟随领域的未来研究。