Oct, 2024

R-CoT:反向思维链几何推理问题生成用于大型多模态模型

TL;DR本研究解决了大型多模态模型在几何数学推理中因高质量图像-文本配对数据不足而面临的问题。提出的反向思维链(R-CoT)生成管道通过引入GeoChain生成高保真几何图像及其描述,并采用反向问答法进行逐步推理,从而生成问题。实验证明,该方法在多个基准上显著提升了性能,尤其在MathVista和GeoQA数据集上,R-CoT-8B超越了现有的开源数学模型和GPT-4o。