May, 2023

重新审视非英语文本简化:一个统一的多语言基准

TL;DR该研究介绍了MultiSim基准,这是一个包含27种语言的12种不同语言资源的集合,其中包含超过170万个复杂-简单句对,使用预训练的多语言语言模型进行的实验表明具有激动人心的性能提升,证实了跨语言的可行性。