Mar, 2024

利用代码交替改进语义检索的跨语言表示

TL;DR本研究提出了一种基于代码切换的备选跨语言 PTM 方法用于语义检索,通过引入代码切换的持续预训练,相对于直接使用 PTM 在语义检索任务上的方法,我们的方法在二十多种语言的三个商业语料库和四个开放数据集上连续超过了之前的 SOTA 方法。