BriefGPT.xyz
大模型
Ask
alpha
关键词
logic problems
搜索结果 - 2
导航迷宫:评估和提高 LLMs 处理搜索问题的能力
最近,大型语言模型在数学和推理基准测试中取得了令人瞩目的表现。但是,它们在对人类而言相对容易的逻辑问题和谜题上仍然经常遇到困难。为了进一步研究这个问题,我们引入了一个名为 SearchBench 的新基准测试,其中包含 11 种独特的搜索问
→
PDF
17 days ago
聊天机器人在数学和逻辑问题中的应用:ChatGPT-3.5、ChatGPT-4 和 Google Bard 的初步比较和评估
对基于大型语言模型的三个聊天机器人(ChatGPT-3.5、ChatGPT-4 和 Google Bard)进行了比较,重点关注它们解决数学和逻辑问题的能力,并通过一系列测试发现对于简单的算术、代数表达式和基本的逻辑谜题,聊天机器人可能会提
→
PDF
a year ago
Prev
Next