COLINGApr, 2024

通过跨语言迁移辅助构建日文文档级关系抽取数据集

TL;DR将英文资源应用于日语的文档级关系抽取任务,构建了一个通过将英文数据集转化为日语的数据集,并将模型预测结果用于人工标注,减少了大约 50%的人工编辑步骤。该研究评估了现有的 DocRE 模型在所构建数据集上的性能,并揭示了日语和跨语言 DocRE 的挑战。