May, 2023
XTREME-UP: 面向用户的稀缺数据基准测试,用于代表性不足的语言
XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented Languages
Sebastian Ruder, Jonathan H. Clark, Alexander Gutkin, Mihir Kale, Min Ma...
TL;DR该研究提出了一个针对语言严重不足的情况的基准测试 XTREME-UP 来评估语言模型对 88 种语言的能力,比传统的零样本测试更具实际价值,侧重于用户中心的任务,包括 ASR,OCR,MT 和信息访问任务,并提供多种建模场景的方法学。