利用摘要指导进行医学报告摘要

Feb, 2023

Leveraging Summary Guidance on Medical Report Summarization

Yunqi Zhu, Xuebing Yang, Yuanyuan Wu, Wensheng Zhang

TL;DR本研究提出了三个去识别化的医学文本数据集，命名为 DISCHARGE、ECHO 和 RADIOLOGY，共包含 50K、16K 和 378K 的报告和摘要对，作者在这些数据集上使用基于预训练编码器 - 解码器语言模型的有说服力的自动抽象摘要基线，并基于 BART 模型利用训练集的示例摘要作为先验知识引导来增强编码器和解码器的上下文表示，实验结果证实了这种方法在 ROUGE 分数和 BERTScore 上的改进，超过了更大模型 T5-large。

Abstract

This study presents three deidentified large medical text datasets, named DISCHARGE, ECHO and RADIOLOGY, which contain 50K, 16K and 378K pairs of report and summary that are derived from MIMIC-III, respectively. We implement convincing baselines of automated abstractive summarization o

deidentified medical text datasets automated abstractive summarization pre-trained encoder-decoder models contextual representation rouge scores

发现论文，激发创造

将放射学报告结果提炼为结论

病人交接和分诊是医疗保健中的两个基本问题。为了高效地与专科医生沟通并快速决策哪些患者需要最紧急的医疗，医生们经常需要费力地总结复杂的发现。在探索这些挑战的过程中，我们提出了一种模型（1），该模型具有最先进的放射学报告摘要性能，并采用一种新的医疗数据增强方法（2），还对模型的局限性和放射学知识增长进行了分析（3）。此外，我们还为基于 MIMIC CXR 数据集开发的未来模型提供了数据处理流程。我们最好的模型是一个经过微调的 BERT-to-BERT 编码器 - 解码器，具有 58.75/100 的 ROUGE-L F1 得分，其表现优于带有更复杂的注意机制的专用检查点。我们在本文中研究了这些方面。

May, 2024

电子健康档案的神经摘要

本文使用神经网络模型对医院出院总结报告进行自动摘要，结论表明以护理笔记为来源，离散化分离出院总结报告的各个部分作为目标输出来训练语言模型可以提高模型效率和文本质量。

May, 2023

RadBARTsum: 放射学报告摘要的去噪序列到序列模型的领域适应

该研究提出了 RadBARTsum，一种领域特定的、本体学支持的适应 BART 模型的放射学报告摘要方法。该方法包括两个主要步骤：1）使用一种新颖的实体屏蔽策略在大量放射学报告语料库上重新训练 BART 模型以提高生物医学领域知识学习，2）使用调查结果和背景部分进行模型微调以预测结论部分。实验采用不同的屏蔽策略进行，结果显示使用领域知识屏蔽的重新训练过程在各种设置下均能持续提高性能。该工作为放射学报告摘要提供了一种领域特定生成型语言模型，以及一种利用医学知识实现实体屏蔽语言模型的方法。所提出的方法展示了通过加深对放射学报告的临床知识理解来提高语言模型效率的一个有希望的方向。

Jun, 2024

CUED 在 ProbSum 2023 的分层摘要模型集成

本文提出了将 Clinical-T5 和 Hierarchical Ensemble of Summarization Models 与 Minimum Bayes Risk 解码相结合来改善医疗笔记摘要的性能，实现了在共享任务领先的 ROUGE-L32.77

Jun, 2023

放射学报告总结的指导：实证评估和错误分析

自动生成放射学报告的简明摘要可以减轻临床医生的手动负担，并提高报告的一致性。本研究解决了当前方法依赖领域特定资源和了解错误和失败模式的不足，并提出了一种领域无关的变长提取式摘要作为导向信号，进一步改进了自动摘要的效果，并发现自动摘要与放射学家的最大差异在于内容选取和错误分析，对未来研究提出了有希望的方向。

Jul, 2023

探索日本最大的多机构健康记录档案中无结构健康记录的最佳粒度提取摘要

该论文旨在探讨医学专业自动文本摘要中的不同单位粒度，病历中的概念应该是如何被提取和组合的，研究发现将医学病历划分为更小的单位可以获得更高的文本摘要的准确性。

Sep, 2022

自动化神经病学患者出院总结医院病程的方法

研究了使用编码器 - 解码器序列转序列变换模型自动生成患者住院期间医院记录的方法，并评估了此方法的效果，评分较高。

May, 2023

利用聚合的大型语言模型集合保留长期临床文本的知识

利用聚合集成的大型语言模型的新方法，能够保留长篇临床文本的知识，改善大型语言模型在处理长篇输入和多样化数据集时的性能，并在预测临床结果方面取得了比基线、集成和聚合方法更好的结果。

Nov, 2023

自动构建放射学报告的集成方法

本研究提出了一种基于文本属性的整合方法，包括三个模型：聚焦句模型、周围上下文模型和格式 / 布局模型，采用双向 LSTMs 和句子编码来获取上下文，结合多个特征和报告结构进行自动标注，取得了相对于其他方法来说更好的 97.1% 精度。

Oct, 2020

Shimo Lab 在 “Discharge Me!”：通过提示驱动的电子病历章节拼接进行出院总结

我们提出了一种方法来通过从电子健康记录（EHR）中提取相关部分并添加解释性提示来生成 “Brief Hospital Course” 和 “Discharge Instructions” 段落，从而减少医生在写入详细笔记方面所需的时间和工作量。我们的方法在 ClinicalT5-large 模型上进行了 LoRA 微调来训练文本生成模型，在最终测试数据中实现了 0.394 的 ROUGE-1 得分，与顶级解决方案相当。

Jun, 2024