BriefGPT.xyz
Ask
alpha
关键词
docmath-eval
搜索结果 - 1
DocMath-Eval:评估 LLMs 在理解带表格数据的长文档中的数值推理能力
该论文介绍了 DocMath-Eval,这是一个特意设计用于评估具有理解和分析既包含文本又包含表格的金融文件的 LLMs 的数值推理和问题解决能力的综合基准测试。我们评估了 19 个 LLMs 的广泛领域的表现,并采用不同的提示策略来全面评
→
PDF
8 months ago
Prev
Next