Mar, 2022

Auto-MLM: 自监督多语言知识检索的改进对比学习

TL;DR本文提出一种结合对比学习和自动编码器掩码语言模型的联合训练方法,用于自我监督多语言知识检索,通过生成新的标记表示来预测掩码标记,实验结果表明,在 8 种语言上,我们的提出的方法在 AliExpress 和 LAZADA 服务语料库和公开可用的语料库上都 consistently 超过了所有先前的 SOTA 方法。