Jul, 2021

BERT对事件事实性的判断不如医生的判断:在语用上失败了

TL;DR本研究通过分析多个英文数据集探究BERT在预测事实性方面的性能表现,发现虽然BERT在大多数数据集上表现强劲,但是它的高精度是通过利用表层格式与特定事实标签的关联性达成的,并且对需要实用推理的案例失败。因此,我们仍然远离拥有强健性的事实性预测系统。