Oct, 2023

通过逐层维度选择从预训练语言模型中解析单词语义

TL;DR该论文使用二进制掩码对预训练模型中不同层的输出进行切割,以解离BERT中的语义意义,而不更新预训练参数,从而产生解离的嵌入表示。使用二进制分类验证解离的嵌入的效果,判断两个不同句子中目标词的含义是否相同。实验结果表明,利用层次信息是有效的,而解离的语义意义进一步提高了性能。