该研究对现有关于电子病历问答的工作进行了方法学综述,发现电子病历问答是相对较新且未被充分探索的研究领域,对于电子病历问答数据集和模型的使用进行了分析。
Oct, 2023
使用医疗记录自然可用的数据,XAIQA 通过分类模型解释器生成大规模的合成问答对,提升了 GPT-4 作为抽取式问答模型的性能。
Dec, 2023
本文介绍了如何使用合成领域特定数据集来改进问答的性能,通过实验表明使用该方法 fine-tune 下游模型的表现得到了显著的提升。
Nov, 2022
利用 PubMed 作为可靠的医学研究文档集合,针对开放领域的问答设置,研究通过修改检索设置来提高问答系统性能的方法。结果显示,减少检索到的文档数量,偏爱近期和被引用次数较多的文献可以提高最终的宏观 F1 得分达到 10%。
Apr, 2024
该研究开发了第一个多模式药物电子健康记录问答数据集,其中包含从公开可用的电子健康记录中结构化表格和非结构化笔记中提取的问答对。研究目的是为多模式问答系统提供基准数据集,并通过使用非结构化临床数据的上下文来改善电子健康记录结构化数据上的问答。
May, 2022
本文设计了程序为基础的模型(NLQ2Program)以利于未来拓展医疗多模态数据和解决复杂推理的电子健康记录问答任务,该模型在没有金标程序的情况下表现良好,运用不确定性分解方法可测度输入问题的模糊性。
Mar, 2022
通过重新利用其他 NLP 任务的现有注释,我们提出了一种新的方法来生成特定领域的大规模问答(QA)数据集。我们利用社区共享的 i2b2 数据集中临床笔记的现有专家注释,生成了大规模的电子医疗记录 QA 数据集 emrQA,其中包含 100 万个问题 - 逻辑形式对和 40 多万个问题 - 答案证据对,并通过基线模型训练来探索其学习潜力。
Sep, 2018
本文提出了一种新的基于问题蕴含识别(Recognizing Question Entailment)的问答(Question Answering)方法,基于机器学习和深度学习算法,结合信息检索模型,在医疗领域实现了显著的问答准确率提升。
Jan, 2019
电子健康记录的总结可以极大地减少患者和医务人员的 “屏幕时间”。近年来,通过使用最先进的神经模型,电子健康记录的总结已经采用了机器学习流程。然而,这些模型产生了不够令人满意的结果,这要归因于很难获取足够的注释数据进行训练。此外,考虑到电子健康记录的整个内容在总结中的要求,由于现代大型语言模型(LLMs)中的注意机制增加了二次复杂度,导致性能较差。我们在此提出了一种方法,通过结合语义搜索、检索增强生成(RAG)和使用最新的 LLMs 的问答方法来减轻这些缺点。在我们的方法中,总结是根据专业学科专家(SMEs)认为的重要问题的答案的提取。我们的方法非常高效;几乎不需要训练;不会受到 LLMs 的 “幻觉” 问题的困扰;而且可以确保多样性,因为总结中不会有重复的内容,而是针对特定问题的多样答案。
Jan, 2024
本文综述了传统信息检索方法和深度神经网络方法在文本问答任务中的应用,介绍了相关模型以及可供比较的数据集和文献结果。
Feb, 2020