Oct, 2019

BERT 从多项选择阅读理解数据中学到了什么?

TL;DR通过对多选阅读理解数据集进行实验,本文发现:1)BERT 模型主要是依靠关键字来进行答案预测,而不是通过语义理解和推理;2)BERT 模型不需要正确的句法信息来解决任务;3)这些数据集中存在着一些人工痕迹,即使没有完整上下文也可以解决任务。