WSDMOct, 2019

使用语言模型预训练的医疗命名实体识别模型

TL;DR本文介绍了一种从非结构化电子医疗记录中提取结构化信息的方法,该方法通过自然语言处理技术和网络注释工具的组合应用,优化了使用少量训练数据训练的定制命名实体识别模型的性能,并展示了该技术与现有方法相比的优势。研究结果表明,在仅使用 50% 的训练数据的情况下,我们的方法训练的模型的 F1 得分可达到 0.734,而当前流行的方法训练的不带语言模型组件的 spaCy 模型的 F1 得分为 0.704。