Apr, 2024

ClinLinker:西班牙语临床概念提及的医学实体链接

TL;DR这项研究通过使用一种新颖的双阶段流程来实现医学实体链接,该流程利用领域内适应的语言模型进行生物医学文本挖掘,从而显著提升了临床文本分析的性能。该方法在西班牙语内容的初期侧重下,在涉及异构医学术语并在原始数据子集上进行训练的复杂场景中,显著优于为同一目的设计的多语言语言模型。通过在两个不同的临床实体链接 Gold Standard 语料库(DisTEMIST(疾病)和 MedProcNER(临床程序))上进行评估,我们的结果表明,该方法在 25 个 Top-k 准确度和其他 Top-k 指标上的性能优于前期基准,DisTEMIST 上提高了 40 个点,MedProcNER 上提高了 43 个点,两者均归一化到 SNOMED-CT 代码。这些发现突显了我们的方法在处理语言特定细微差别方面的能力,并树立了一个新的实体链接基准,为提高数字医疗记录的实用性提供了一种强大工具。该系统的结果具有实际价值,既可以用于从临床记录中自动产生大规模结构化数据,也可用于全面提取和协调预定义的临床变量。