Mar, 2024

多语句-T5:可扩展的多语句编码器适用于多语言应用

TL;DR我们介绍了基于NLI的多语言句子嵌入模型m-ST5,通过扩展现有的单语模型Sentence T5以低秩适应(LoRA)技术成功将模型参数规模扩展到57亿,并通过实验证实方法优于基于NLI的先前方法,尤其是对资源较少或与英语相似性较低的语言受益更多。