Apr, 2023

L3Cube-IndicSBERT:使用多语言 BERT 学习跨语言句子表示的简单方法

TL;DR该论文提出了一种用于转换 vanilla multilingual BERT 模型成多语言句子 BERT 模型的简单有效方法,该方法使用合成语料库聚合并细调 vanilla multilingual BERT 模型的翻译 NLI 或 STS 数据集,展示了多语言 BERT 模型的跨语言学习能力,该方法在 10 种主要的印度语言以及德语和法语这些非印欧语系的语言上均取得了很好的效果,进而实现了首个针对印度语言 Hindi、Marathi、Kannada、Telugu、Malayalam、Tamil、Gujarati、Odia、Bengali 和 Punjabi 的多语言句子表示模型。