Jul, 2022

Hansel: 一个中文 Few-Shot 和 Zero-Shot 实体链接基准

TL;DR该论文提出了一个新的中文实体链接数据集Hansel,用于解决现有实体链接系统中流行度偏差和英语以外语言中低频和新兴实体的缺乏问题。该数据集包含来自新闻、社交媒体和其他网络文章的10K个多样化文档,使用Wikidata作为其目标知识库,并展示在其上的实体链接模型的性能表现。