从复杂的医患对话中改进临床笔记生成
本文提出了一种预测病历记录中病人的过去数据,包括人口统计学,检验,药物和过去的笔记,预测未来笔记内容的新型语言建模任务,并使用公开的、去个人化的MIMIC-III数据集训练生成模型。我们发现大部分笔记的内容都可以被预测,并且学习了许多常见的笔记模板。本文探讨了这样的模型如何在支持辅助笔记编写功能方面是有用的,比如错误检测和自动完成。
Aug, 2018
通过使用深度总结模型生成SOAP注释,Cluster2Sent算法可以提取与每个总结部分相关的重要话语,并将相关话语聚集在一起,然后生成每个类别的一句总结。
May, 2020
本文介绍了开发医疗笔记生成系统的过程中所进行的三轮用户研究,包括如何适应临床实践、系统设计以及参与临床实践的临床医生对该系统的印象和看法,并发现了五种不同的记录行为、实时笔记生成的重要性以及自动生成笔记系统可能面临的几种挑战性情况。
May, 2022
本文介绍了我们在MEDIQA-Chat 2023共享任务中对于从医生-患者对话自动生成临床笔记的提交。我们报道了两种方法的结果:第一种微调共享任务数据上的预训练语言模型(PLM),第二种使用大型语言模型(LLM)进行少量样本的上下文学习(ICL)。两种方法在自动指标(如ROUGE,BERTScore)上均实现了高性能,并分别排名共享任务的二和一位。专业人士的审查表明,通过基于ICL的方法和GPT-4生成的笔记与人工书写的笔记一样受欢迎,这使其成为从医生-患者对话自动生成笔记的有前途的途径。
May, 2023
本文旨在研究自动生成临床笔记的评估方法和度量标准,提出了新的任务特定度量标准,并将其与现有文本摘要和生成的SOTA度量标准进行比较,研究分布和测量不同的自动摘要的正确性,并试图确定与人类判断相一致的最佳自动评估指标。
May, 2023
医生在每次患者访问后撰写的详细临床记录对医生和研究人员至关重要。利用语言模型自动化创建这些记录可以减轻医生的工作负担。本文介绍了NoteChat,一个利用大型语言模型生成基于临床记录的合成医患对话的协作多代理框架。NoteChat包括规划、角色扮演和润色模块。通过与OpenAI的ChatGPT和GPT-4等最先进模型进行全面的自动和人工评估,结果表明NoteChat促进了高质量的合成医患对话,突显了语言模型在医疗保健中的潜力。这项工作是多个语言模型合作完成以临床记录为条件的医患对话的首次示例,为人工智能与医疗保健的交叉领域提供了有前景的途径。
Oct, 2023
LLMs是NLP任务的革命性技术,但是像GPT-4这样功能强大的LLM对于大多数特定领域的场景来说价格过高。我们提出了第一个基于13B Llama2的连续训练的LLM,该模型专门用于医学对话,并通过自动撰写进行了衡量。结果表明,我们的模型在PubMedQA中的准确度达到了76.6%,并且在将医学对话总结为SOAP笔记方面与GPT-4的性能相当。值得注意的是,我们的模型能够捕捉更多正确的医学概念,超越GPT-4,并以更高的正确性和完整性胜过人工撰稿人。
Mar, 2024
在本研究中,我们展示了一个小型开源语言模型(LLMs)可以有效地从门诊患者-医生对话中生成高质量的临床笔记,通过包括持续预训练、监督微调和强化学习在内的综合的领域和任务特定的自适应过程。我们通过增强方法DistillDirect,以Gemini Pro作为教师模型,在策略上进行了强化学习。我们的研究证明了训练较小、开源的LLMs以辅助临床文档编写的潜力和可行性,充分利用医疗机构对患者记录和领域专业知识的访问。
Apr, 2024
综合临床记录,生成式人工智能(AI),自然语言处理(NLP),自动语音识别(ASR)和医疗保健环境是本研究的关键词。研究发现生成式AI有潜力改变临床记录实践,减轻行政负担,使医疗保健专业人士更专注于直接病人护理。
May, 2024
本研究解决了临床笔记草稿质量不足的问题,提出了一种新技术来模拟医生的对话风格和笔记偏好。此外,研究中引入了一种新方法,以便在缺乏足够临床笔记的情况下为新医生注册,而无需重新训练模型。结果表明,该技术在多个评估指标上明显优于基线模型。
Aug, 2024