EMNLPOct, 2023

重新思考对预训练语言模型机制的有效度量构建

TL;DR提出了一种通过拓扑探针度量预训练语言模型内部关系的方法,并在 BERT-large 上进行实验。基于实验结果,提出了关于 BERT-like 预训练语言模型工作机制的假设,并提出了通过拓扑探针提高特定子模块微调性能的策略。