Feb, 2024

ColBERT-XM: 零射多语信息检索的模块化多向量表示模型

TL;DR这项研究提出了一种新颖的模块化密集检索模型ColBERT-XM,它通过学习单个高资源语言的丰富数据,并能够有效地零-shot转换到各种语言,从而消除了对特定语言的标记数据的需求。通过展示在零-shot场景中的娴熟表现,ColBERT-XM标志着向更可持续和包容的检索系统的转变,实现了多种语言的有效信息获取。我们公开发布我们的代码和模型供社区使用。