大型语言模型在组合性关系推理中的限制探索

Mar, 2024

Exploring the Limitations of Large Language Models in Compositional Relation Reasoning

Jinman Zhao, Xueyan Zhang

TL;DR通过包含1,500个测试案例的评估，我们在英语中全面评估了大型语言模型（LLMs）在推理组合关系方面的能力，旨在了解LLMs处理不同语言环境下的组合关系推理的鲁棒性和适应性。

Abstract

We present a comprehensive evaluation of large language models(LLMs)' ability to reason about composition relations through a benchmark en