May, 2023

XTREME-UP: 面向用户的稀缺数据基准测试,用于代表性不足的语言

TL;DR该研究提出了一个针对语言严重不足的情况的基准测试 XTREME-UP 来评估语言模型对 88 种语言的能力,比传统的零样本测试更具实际价值,侧重于用户中心的任务,包括 ASR,OCR,MT 和信息访问任务,并提供多种建模场景的方法学。