BriefGPT.xyz
Ask
alpha
关键词
reasoning and understanding abilities
搜索结果 - 1
当 LLM 遇到狡猾问题:一个针对大型语言模型的谬论理解基准测试
我们在这篇论文中通过提出一个包含狡猾问题的 FaLlacy Understanding Benchmark (FLUB) 来挑战大型语言模型的推理和理解能力,该 Benchmark 包含了从真实互联网环境中收集的棘手、幽默和误导性问题,我们
→
PDF
5 months ago
Prev
Next