Feb, 2024

ELECTRA 句子嵌入是否无法修复?语义文本相似度的案例研究

TL;DR通过修复 ELECTRA 模型的嵌入方式,提出了一种新的修剪模型微调(TMFT)方法,可以显著提高其在 STS 基准数据集上的 Spearman 相关系数,并增加参数效率;该方法与词相似性任务或领域自适应预训练相结合进一步提升了性能。