Oct, 2022

探索预训练语言模型的模式连通性

TL;DR本文研究了预训练语言模型在不同配置下产生的极小值之间的几何连接及其任务知识随路径的变化情况,旨在通过探索 PLM 的模式连接来了解不同最小值之间的几何连接,从而有助于理解 PLM 下游适应的内部工作机制。