Nov, 2023

使用 RoBERTa 和正则表达式从临床记录中提取牙周炎诊断

TL;DR利用文本处理和自然语言处理模型来挖掘临床笔记以诊断牙周炎,并评估命名实体识别模型在不同正则表达式方法上的性能。研究表明,随着正则表达式算法复杂度的增加,F1 分数从 0.3-0.4 增加到约 0.9。命名实体识别模型在评估指标中表现出优异的预测能力,简单的正则表达式方法达到 0.84-0.92,高级和组合方法达到 0.95-0.99。该研究以提供将命名实体识别方法和自然语言处理模型相结合从自由文本中提取目标信息并填补诊断遗漏的需求为例。