Feb, 2019

MedMentions: 一个带有 UMLS 概念注释的大型生物医学语料库

TL;DR介绍了 MedMentions 作为一种新的手动注释的生物医学概念识别资源,并描述了其 UMLS 2017 概念本体论中超过 3 百万个具体概念和 4000+ 个文摘和 350,000 多个链接提到的规模以及广泛覆盖生物医学学科领域的优点。同时,也提出了 MedMentions 子集,支持针对文档检索的实体识别任务。该数据集已包含训练、测试集,并且还提供了 Named Entity Recognition 的基线模型以及其指标,以鼓励相关领域的研究。