Aug, 2022

多方对话中多语言指代消解

TL;DR本文提出 Multilingual Multiparty Coref (MMC) 数据集用于核心参照消解任务,通过注释的转录来提供其他语言 (中文和波斯语) 的银参照数据,在英文数据中,现有的模型在 MMC 上的表现相对较差,说明 MMC 具有比先前数据集更广泛的多方参照覆盖范围。在银数据上,我们发现在模拟零 - shot 跨语言环境方面,使用它进行数据增强和从头开始的训练都很成功。