May, 2023

所有路都通罗马?探究 Transformers 表征的不变性

TL;DR研究了 transformer models 中关于 representation 的可靠性问题,提出了双射假设和一种基于可逆神经网络的模型 BERT-INN,用来更有效地对齐不同模型的 representation spaces