May, 2023

通过大型语言模型增强视觉语言模型的推理能力

TL;DR本文提出了一种名为 TReE 的方法,用于在零样本场景中将大型语言模型(LLMs)的推理能力转移给视觉语言模型(VLM),包含观察、思考和重新思考三个阶段。