Aug, 2024

重新考虑预训练语言模型的词元嵌入及其定义

TL;DR本研究针对目前预训练语言模型中词元嵌入产生的非各向同性问题及低频词的语义信息流失进行分析。提出的DefinitionEMB方法通过利用定义构建语义相关且各向同性的词元嵌入,保持了模型的鲁棒性。实验结果表明,该方法显著提升了低频词的模型性能,尤其在各种GLUE和文本摘要数据集上表现出色。