EMNLPNov, 2022

建筑瓶颈原则

TL;DR本文研究了神经网络组件从输入的表示中可以提取多少信息,提出了建立合适探针的原则,并用该原则评估了 transformers 的句法信息提取能力。实验发现,BERT、ALBERT 和 RoBERTa 等模型的表示中可以提取句法信息,但这些信息是否被真正使用还需要进一步的探究。