Feb, 2024

DANSK 和 DaCy 2.6.0:丹麦命名实体识别的领域泛化

TL;DR本篇论文介绍了一个提供高精度标记和跨多领域模型评估的丹麦命名实体识别数据集 DANSK,以及具备细粒度注释的 DaCy 2.6.0 模型,通过对现有和新模型的评估揭示了跨领域的性能差异,并讨论了数据集的注释质量缺陷及其对模型训练和评估的影响, despite these limitations,该论文主张在丹麦命名实体识别领域同时使用这个新数据集 DANSK 并进行进一步的领域通用性研究。