BriefGPT.xyz
Ask
alpha
关键词
mathematical reasoning capabilities
搜索结果 - 2
提升大型视觉 - 语言模型对科学理解的多模态 ArXiv 数据集
通过引入多模态 ArXiv 数据集,包括图像标题数据集 ArXivCap 和基于科学图表产生的问答数据集 ArXivQA,以提高大型视觉 - 语言模型(LVLMs)在科学理解方面的能力,并通过四个视觉到文本任务对 LVLMs 进行了基准评估
→
PDF
4 months ago
初学者学习者与专家导师:评估具有误解的大型语言模型的数学推理能力
我们提出了一种基于数学误解的大型语言模型(LLM)数学推理能力的新评估方法。我们通过模拟 LLMs 作为初学者和专家导师,旨在识别由于特定误解导致的错误答案,并识别一个错误答案背后的误解。与传统基于 LLMs 的数学评估侧重于正确回答数学问
→
PDF
9 months ago
Prev
Next