Oct, 2020

基于阅读理解的问答中BERT的解释研究

TL;DR该论文使用 Integrated Gradients 解释 BERT 在阅读理解中的层次化功能,发现早期层次着重于查询-段落交互,而后期层次集中在上下文理解和应答预测,特别适用于量词问题,即使是在存在混淆的情况下,BERT 仍然能够正确预测答案。