ACLApr, 2020

自然语言推理模型是否令人印象深刻?学习隐含和预设条件

TL;DR本文在构建议程推理和预设的诊断数据集后,评估了在 MultiNLI 训练的 BERT、InferSent 和 BOW NLI 模型学习进行实用推理的能力。结果表明,尽管 MultiNLI 中的很少数的偶合类型表示,但 BERT 可以绘制实用偶合,而 BOW 和 InferSent 则表现出较弱的实用推理证据。