Jan, 2024

基于检索增强生成的问答型电子健康记录摘要

TL;DR电子健康记录的总结可以极大地减少患者和医务人员的“屏幕时间”。近年来,通过使用最先进的神经模型,电子健康记录的总结已经采用了机器学习流程。然而,这些模型产生了不够令人满意的结果,这要归因于很难获取足够的注释数据进行训练。此外,考虑到电子健康记录的整个内容在总结中的要求,由于现代大型语言模型(LLMs)中的注意机制增加了二次复杂度,导致性能较差。我们在此提出了一种方法,通过结合语义搜索、检索增强生成(RAG)和使用最新的LLMs的问答方法来减轻这些缺点。在我们的方法中,总结是根据专业学科专家(SMEs)认为的重要问题的答案的提取。我们的方法非常高效;几乎不需要训练;不会受到LLMs的“幻觉”问题的困扰;而且可以确保多样性,因为总结中不会有重复的内容,而是针对特定问题的多样答案。