EMNLPSep, 2021

变形器语言模型中的流浪维度掩盖了表征质量

TL;DR通过标准化技术等方法探讨相似度测量在 BERT 和 GPT-2 等上下文鉴别模型中的代表性和准确性。我们发现一些不代表整体性质的维度会干扰这些测量,并且这些测量值并不一定代表模型的真实行为。因此,我们认为分析这些模型中基于相似性的操作需要解决这些问题。