MMDec, 2022

评估字节和 Wordpiece 级别的模型在大规模多语言语义分析中的应用

TL;DR本研究研究并比较了一个基于字节的(ByT5)和基于单词片段的(mT5)序列模型在 51 种语言的 MASSIVE 多语种语义分析数据集上的表现,实验结果表明通过使用最新的标签投影方法,机器翻译示例可以显著提高精确度,与在所有语言的黄金数据上训练的模型只有 5 个百分点的差距,并提供了有关 ByT5 的跨语言转移及其相对于 mT5 在所有参数大小上的各自表现的见解。