BriefGPT.xyz
Ask
alpha
关键词
worldsense
搜索结果 - 1
WorldSense:大型语言模型中基于实例推理的合成基准测试
我们提出了 WorldSense,这是一个用于评估 LLMs 在从简单实体排列的描述中进行简单推理时所能维持的隐式世界模型的程度的基准测试。我们在三个最先进的聊天 LLMs(GPT3.5,GPT4 和 Llama2-chat)上运行我们的基
→
PDF
7 months ago
Prev
Next