May, 2023
所有路都通罗马?探究 Transformers 表征的不变性
All Roads Lead to Rome? Exploring the Invariance of Transformers' Representations
Yuxin Ren, Qipeng Guo, Zhijing Jin, Shauli Ravfogel, Mrinmaya Sachan...
TL;DR研究了 transformer models 中关于 representation 的可靠性问题,提出了双射假设和一种基于可逆神经网络的模型 BERT-INN,用来更有效地对齐不同模型的 representation spaces