Feb, 2024

多模式检索增强生成式常识推理

TL;DR提出了一种新颖的多模式检索 (MORE) 增强框架,利用文本和图像来增强语言模型的常识能力。在 Common-Gen 任务上的大量实验表明,MORE 基于单一和多模态的预训练模型具有较高的效果。