Oct, 2024
GeoCoder:通过视觉语言模型生成模块化代码来解决几何问题
GeoCoder: Solving Geometry Problems by Generating Modular Code through
Vision-Language Models
TL;DR本研究针对现有视觉语言模型在几何问题解决中的不足,提出了GeoCoder,通过模块化代码微调生成和执行代码,利用预定义的几何函数库实现了精确计算。研究表明,该方法在GeomVerse数据集上相较于其他微调方法平均提升了超过16%的几何推理能力。