Apr, 2024

WangLab 在 MEDIQA-CORR 2024 中的优化基于 LLM 的医疗错误检测和校正程序

TL;DR医疗文件中的医疗错误对患者安全构成重大风险。本文介绍了我们在三个子任务中均取得顶尖表现的方法,即错误检测、错误句子提取和生成纠正句子。我们利用外部医学问答数据集开发了一套基于检索的系统用于处理微妙错误的 MS 数据集,同时对于反映更真实的临床记录的 UW 数据集,我们创建了一个模块化流程来检测、定位和纠正错误。这两种方法都利用 DSPy 框架来优化大型语言模型程序中的提示和少样本示例。我们的结果表明,基于大型语言模型的程序对于医疗纠错非常有效,但是我们的方法在解决医疗文档中潜在错误的全面多样性方面存在局限性。我们讨论了我们工作的影响,并强调了未来研究方向,以提高医疗错误检测和纠正系统的鲁棒性和适用性。