Aug, 2024

鹰:通过大型语言模型赋能的视觉指导调优提升几何推理

TL;DR该研究针对现有多模态大型语言模型在几何问题解决中的视觉感知不足进行探讨,发现其存在显著的几何感知不准确和幻觉问题。提出EAGLE框架,通过两阶段的视觉增强提升几何推理能力,在多个基准测试中表现优异,超越了现有先进模型,展示了其在几何推理领域的潜在影响。