EMNLPMay, 2022

通过检查注意力映射的拓扑结构进行可接受性判断

TL;DR研究了注意机制在编码语言知识中的作用,并探讨了注意头在判断句子的语法可接受性方面的能力,通过拓扑数据分析显示关注图的几何特性可以有效地被用于二元判断和语言最小对的标准做法,并通过 CoLA 上的三种语言(英语,意大利语和瑞典语)提高了 BERT 基于可接受性分类器的得分 8%-24%。在 BLiMP 基准测试中,通过揭示最小对的注意力图之间的拓扑差异,实现了与人类水平相当的性能,在统计和转换器 LM 基线中优于九个基线。