Feb, 2024

基于体裁和主题特征的选择性屏蔽在专业领域中对语言模型的适应

TL;DR在本文中,我们介绍了一种创新的掩码方法,利用流派和主题信息来定制语言模型以适用于专业领域,该方法基于词语的重要性对其进行排名,并优先选择重要性高的词进行掩码处理,通过在法律领域进行连续预训练实验证明了我们的方法在 LegalGLUE 基准测试中的有效性,同时提供免费使用的预训练语言模型和代码。