May, 2022

RobustLR: 评估演绎推理中对逻辑扰动的稳健性

TL;DR本文通过提出的RobustLR数据集,对当前在英语自然语言逻辑规则库上执行演绎推理的Transformer模型的鲁棒性进行了评估,结果展示这些模型在面临最小改动的逻辑规则库的情况下表现不一致,难以学习逻辑否定和逻辑联合运算符,从而揭示出这些基于推导式推理的自然语言处理模型的一些缺陷。