Oct, 2024

规则破坏者挑战:揭示大型语言模型推理中盲点

TL;DR本研究针对大型语言模型在推理中存在的假设与现实之间的矛盾问题,提出了“规则破坏者”的概念,并构建了RULEBREAKERS数据集来评估模型的识别能力。研究发现,大多数模型在识别规则破坏者的能力上表现不佳,但通过评估其自信度,可以看出它们有潜力区分这些规则破坏者,从而揭示了大型语言模型推理能力的局限性。