BriefGPT.xyz
Ask
alpha
关键词
logicbench
搜索结果 - 1
大型语言模型的逻辑推理能力系统评估
最近发展的大型语言模型 (LLMs) 在各种语言理解任务上表现出色,但它们真正能够对自然语言进行 “推理” 吗?本文综合评估了 LLMS 在涵盖命题逻辑、一阶逻辑和非单调逻辑的 25 种不同推理模式上的逻辑推理能力,并引入了 LogicBe
→
PDF
2 months ago
Prev
Next