Jun, 2022

构建冰岛实体链接语料库

TL;DR本论文介绍了使用 mGENRE 多语言实体链接模型与 Wikipedia API Search(WAPIS)结合的方法,将其用于标注冰岛语数据,并与仅使用 WAPIS 的方法进行比较。结果表明,我们的组合方法在我们的语料库上达到了 53.9%的覆盖率,而仅使用 WAPIS 仅达到了 30.9%的覆盖率。此外,我们分析了未标注的数据,识别数据中的模式,并讨论为什么这些模式可能更难以注释。