Jan, 2024

MultiMUC:MUC-4上的多语言模板填充

TL;DR我们介绍了MultiMUC,这是第一个用于模板填充的多语言平行语料库,包括对经典MUC-4模板填充基准的五种语言(阿拉伯语、中文、波斯语、韩语和俄语)的翻译。我们从一个强大的多语言机器翻译系统获得自动翻译,并手工将原始的英文注释投射到每个目标语言中。对于所有语言,我们还提供了包含注释模板参数的开发和测试分裂中的句子的人工翻译。最后,我们使用MultiMUC展示了基于最新模板填充模型和ChatGPT的基准性能。