May, 2023

IdealGPT: 通过大型语言模型迭代分解视觉和语言推理

TL;DR本论文提出 IdealGPT 框架,通过大语言模型迭代地分解 VL 推理,以解决零样本推理领域中多步推理问题。我们的 IdealGPT 在多个具有挑战性的 VL 推理任务中表现优异,特别是在 VCR 和 SNLI-VE 中相对最好的 GPT-4 模型提高了 10%和 15%。