EMNLPOct, 2023

LLM 在理解逆关系上的无效性研究

TL;DR大型语言模型在形式化语言任务中取得了显著的成功,但目前的基准主要遵循 LLM 的预训练数据分布。本文探讨了 LLM 在一种特殊情况下的结构语义理解能力问题,提出了 ConvRe 基准,通过多项选择问答任务评估 LLM 确定关系和相关文本匹配的能力。实验结果表明,LLM 在该基准上仍存在挑战。