EMNLPOct, 2023

变形金刚中的动词变位是由主语数量的线性编码决定的

TL;DR使用因果干预分析展示,深层架构如 Transformers 不是不透明的 “黑盒” 表示,而是以线性、可解释的形式表示某些语言特征。具体而言,我们表明 BERT 的动词变位能力依赖于一种线性编码的主语数量,在第一层的主语位置和最后一层的动词位置可以操纵并对变位准确性产生可预测的影响。在中间层位置,特别是当有多个主语序号线索时,该编码分布在多个位置之间。