BriefGPT.xyz
Ask
alpha
关键词
wizardmath model
搜索结果 - 1
GeoEval:几何问题解决中评估 LLM 和多模型的基准
最近的大型语言模型(LLMs)和多模态模型(MMs)在问题解决方面展示了卓越的能力,但它们在解决需要对文本和图像信息进行综合理解的几何数学问题方面的熟练程度尚未得到深入评估。为了填补这一空白,我们引入了 GeoEval 基准测试,它包括一个
→
PDF
5 months ago
Prev
Next