Sep, 2022

可能的故事:在多种可能的情景下评估情境常识推理

TL;DR本研究旨在解决自然语言处理中针对多种可能情况下的常识推理问题,通过构建Possible Stories数据集,对预训练语言模型的性能进行评估,结果表明其正确率远低于人类。该数据集包含需要反事实推理,读者反应和虚构信息的示例,可作为未来研究的测试基准。