EMNLPNov, 2022
建筑瓶颈原则
The Architectural Bottleneck Principle
Tiago Pimentel, Josef Valvoda, Niklas Stoehr, Ryan Cotterell
TL;DR本文研究了神经网络组件从输入的表示中可以提取多少信息,提出了建立合适探针的原则,并用该原则评估了 transformers 的句法信息提取能力。实验发现,BERT、ALBERT 和 RoBERTa 等模型的表示中可以提取句法信息,但这些信息是否被真正使用还需要进一步的探究。