BriefGPT.xyz
大模型
Ask
alpha
关键词
mathematical understanding
搜索结果 - 3
Invalsi 基准:测量意大利中文数学和语言理解的语言模型
通过许多模型的评估,研究表明:目前意大利语存在着缺乏针对该语言的预训练语言模型的现象,从而导致意大利语的语言模型评估数据较少。该研究提出了两个基于 11 至 18 岁学生在意大利学校系统中进行的真实测试的评估基准,经多位教学和教育专家验证。
→
PDF
3 months ago
大型语言模型对数学的理解:源批评和推演
GPT-4 的研究调查发现,尽管该模型可以重复、改编和润色其之前见过的数学证明,然而它并未实际理解基本数学概念,而在形式语言中证明数学定理的任务与搜索引擎如 Google 的方法相当,而预测句子中的下一个词可能是一种错误的方法,往往会导致过
→
PDF
8 months ago
EMNLP
Conic10K:一种具有挑战性的数学问题理解与推理数据集
我们提出了 Conic10K,一个具有挑战性的数学问题数据集,主要针对中国高中教育中的二次曲线部分。我们的数据集包含具有不同推理深度的各种问题,仅需要二次曲线部分的知识。通过实验证明,包括 GPT-4 在内的现有大型语言模型在复杂推理方面表
→
PDF
8 months ago
Prev
Next