Nov, 2023

ÚFAL CorPipe 在 CRAC 2023:更大的上下文改善多语种共指消解

TL;DR我们提供的 CorPipe 是 2023 年 CRAC 共享任务多语言共指解析比赛的获胜系统,它是我们之前多语言共指流水线的改进版本,并以 4.5 个百分点的巨大优势超过其他参赛者。CorPipe 首先通过检测提及实体,然后通过在提取的范围上采用先行最大化方法进行共指链接。这两个任务是在所有可用语料库上使用共享的预训练语言模型进行联合训练的。我们的主要改进包括使用大于 512 个子词的输入和更改提及解码以支持组合解。源代码可以在此 https URL 中找到。