ACLJun, 2022

如何解剖木偶:Transformer 嵌入空间的结构

TL;DR本文详细阐述基于 Transformer 架构的预训练嵌入如何用向量因子的总和来重新构造,展示它们在不同应用中成分的影响如何不同,以及微调对于整个嵌入空间的效果,从而与以前的广泛研究建立联系.