ICMLMar, 2024

大型语言模型在组合性关系推理中的限制探索

TL;DR通过包含 1,500 个测试案例的评估,我们在英语中全面评估了大型语言模型(LLMs)在推理组合关系方面的能力,旨在了解 LLMs 处理不同语言环境下的组合关系推理的鲁棒性和适应性。