Oct, 2020

MedCAT多领域临床自然语言处理:医学概念标注工具包

TL;DR介绍了一种开源的医学概念注释工具(MedCAT),该工具使用自我监督的机器学习算法从电子医疗记录中提取UMLS/SNOMED-CT概念,从而实现了对大量结构化文本的临床分析。该工具包括:自定义和训练IE模型的功能丰富的注释界面;以及与CogStack生态系统的集成用于厂商无关的卫生系统部署。现实世界的验证表明,该工具在大型伦敦医院的SNOMED-CT提取方面的性能表现很好,表明了跨领域的EHR-agnostic实用性,可加速临床和研究用例。