基于问答的综合中文电子健康记录信息提取的流程

Feb, 2024

基于问答的综合中文电子健康记录信息提取的流程

A Question Answering Based Pipeline for Comprehensive Chinese EHR Information Extraction

Huaiyuan Ying, Sheng Yu

TL;DR提出了一种新的方法，自动生成用于 QA 模型的迁移学习的训练数据，该模型在电子健康记录的信息提取子任务中表现出色且能够有效处理少样本或零样本情况的问题。

Abstract

electronic health records (EHRs) hold significant value for research and applications. As a new way of information extraction, question answering (QA) can extract more flexible information than conventional metho

electronic health records question answering annotated data transfer learning extractive qa frameworks

发现论文，激发创造

电子健康记录的问答：数据集和模型的综述

该研究对现有关于电子病历问答的工作进行了方法学综述，发现电子病历问答是相对较新且未被充分探索的研究领域，对于电子病历问答数据集和模型的使用进行了分析。

Oct, 2023

XAIQA：用于提取式问答的基于解释器的数据增强

使用医疗记录自然可用的数据，XAIQA 通过分类模型解释器生成大规模的合成问答对，提升了 GPT-4 作为抽取式问答模型的性能。

Dec, 2023

生成、注释并使用合成数据的管道以用于现实世界中的问答

本文介绍了如何使用合成领域特定数据集来改进问答的性能，通过实验表明使用该方法 fine-tune 下游模型的表现得到了显著的提升。

Nov, 2022

通过可靠和时间感知的证据检索改善健康问题回答

利用 PubMed 作为可靠的医学研究文档集合，针对开放领域的问答设置，研究通过修改检索设置来提高问答系统性能的方法。结果显示，减少检索到的文档数量，偏爱近期和被引用次数较多的文献可以提高最终的宏观 F1 得分达到 10%。

Apr, 2024

DrugEHRQA：一个针对医学相关查询的结构化和非结构化电子病历问答数据集

该研究开发了第一个多模式药物电子健康记录问答数据集，其中包含从公开可用的电子健康记录中结构化表格和非结构化笔记中提取的问答对。研究目的是为多模式问答系统提供基准数据集，并通过使用非结构化临床数据的上下文来改善电子健康记录结构化数据上的问答。

May, 2022

针对结构化电子病历的问答不确定性感知文本转程序

本文设计了程序为基础的模型（NLQ2Program）以利于未来拓展医疗多模态数据和解决复杂推理的电子健康记录问答任务，该模型在没有金标程序的情况下表现良好，运用不确定性分解方法可测度输入问题的模糊性。

Mar, 2022

emrQA：基于电子病历的问题回答的大型语料库

通过重新利用其他 NLP 任务的现有注释，我们提出了一种新的方法来生成特定领域的大规模问答（QA）数据集。我们利用社区共享的 i2b2 数据集中临床笔记的现有专家注释，生成了大规模的电子医疗记录 QA 数据集 emrQA，其中包含 100 万个问题 - 逻辑形式对和 40 多万个问题 - 答案证据对，并通过基线模型训练来探索其学习潜力。

Sep, 2018

一个基于问题蕴涵的问答方法

本文提出了一种新的基于问题蕴含识别（Recognizing Question Entailment）的问答（Question Answering）方法，基于机器学习和深度学习算法，结合信息检索模型，在医疗领域实现了显著的问答准确率提升。

Jan, 2019

基于检索增强生成的问答型电子健康记录摘要

电子健康记录的总结可以极大地减少患者和医务人员的 “屏幕时间”。近年来，通过使用最先进的神经模型，电子健康记录的总结已经采用了机器学习流程。然而，这些模型产生了不够令人满意的结果，这要归因于很难获取足够的注释数据进行训练。此外，考虑到电子健康记录的整个内容在总结中的要求，由于现代大型语言模型（LLMs）中的注意机制增加了二次复杂度，导致性能较差。我们在此提出了一种方法，通过结合语义搜索、检索增强生成（RAG）和使用最新的 LLMs 的问答方法来减轻这些缺点。在我们的方法中，总结是根据专业学科专家（SMEs）认为的重要问题的答案的提取。我们的方法非常高效；几乎不需要训练；不会受到 LLMs 的 “幻觉” 问题的困扰；而且可以确保多样性，因为总结中不会有重复的内容，而是针对特定问题的多样答案。

Jan, 2024

从信息检索和深度神经网络角度的基于文本的问答：一项综述

本文综述了传统信息检索方法和深度神经网络方法在文本问答任务中的应用，介绍了相关模型以及可供比较的数据集和文献结果。

Feb, 2020