Dec, 2022

IndicXTREME:用于评估印度语言的多任务基准

TL;DR本文介绍了 IndicXTREME,一个由 9 个不同任务组成的基准测试,包括来自印度次大陆、属于 4 个不同语系的 18 种语言。我们更新和扩展了 IndicCorp,提供了 IndicBERT v2,并证明了它优于现有的多语言语言模型,如 XLM-R 和 MuRIL。