Nov, 2023

CRAB:评估现实世界事件之间因果关系的强度

TL;DR通过引入 CRAB(Causal Reasoning Assessment Benchmark)来评估自然语言处理中事件因果关系的理解能力,发现大部分语言模型在复杂因果结构中的因果推理上表现不佳。