BERT 失败时 -- 电子病历分类的限制

Jul, 2022

BERT 失败时 -- 电子病历分类的限制

When BERT Fails -- The Limits of EHR Classification

Augusto Garcia-Agundez, Carsten Eickhoff

TL;DR使用 Transformer 能够有效地进行临床决策支持，但是存在预测性能不佳的情况，本文研究了一种预测失败的案例，并报告了导致预测性能差的模式。

Abstract

transformers are powerful text representation learners, useful for all kinds of clinical decision support tasks. Although they outperform baselines on →

transformers clinical decision support readmission prediction failure case predictive performance

发现论文，激发创造

Med-BERT: 基于大规模结构化电子病历的预训练上下文化嵌入，用于疾病预测

Med-BERT 是一种基于 BERT 框架训练的语境嵌入模型，适用于在数据集较小的情况下预测疾病。通过电子病历研究心力衰竭和胰腺癌的预测，表明 Med-BERT 具有较高的准确性和泛化性能，可以大幅提升深度学习模型的性能和推广医疗人工智能的发展。

May, 2020

BEHRT: 面向电子健康记录的 Transformer 模型

本研究介绍了 BEHRT：一种深度神经序列转导模型，可用于 EHR（电子病历）的多任务预测和疾病轨迹映射，提供高精度的个性化疾病预测，并可通过其注意力机制提供疾病轨迹的个性化视角。

Jul, 2019

层级 Transformer 用于长文档分类

该研究介绍了如何通过引入基于循环层或其他 Transformer 的单输出层对长文本进行 BERT 模型的微调，成功将其应用于客户电话满意度预测和话题分类任务中，并在两个任务中取得了显著的改进。

Oct, 2019

BERT 面向长文档的案例研究：自动化 ICD 编码

本研究证明了一种简单可扩展的方法，使用已有的 Transformer 模型（如 BERT）处理长文本在 ICD 编码上的表现明显优于以往，比 CNN-based 模型更为出色。

Nov, 2022

ClinicalBERT：医疗记录建模和医院复诊预测

本文使用双向转换器（ClinicalBERT）开发和评估了临床笔记的表示方法，该方法发现了医学概念之间的高质量关系，并在 30 天医院再入院预测方面优于基线，使用的数据为出院小结和重症监护室的前几天的笔记。

Apr, 2019

基于 BERT 的生物医学实体标准化排名

本研究中，我们提出了一种实体归一化架构，通过微调预训练的 BERT/BioBERT/ClinicalBERT 模型，并使用三种不同类型的数据集进行了广泛的实验，评估了预训练模型用于生物医学实体归一化的有效性。我们的实验结果表明，最佳微调模型始终优于以前的方法，并提高了生物医学实体规范化的最新水平，精确度提高了高达 1.17％。

Aug, 2019

针对实验室协议的领域特定 BERT 表示进行命名实体识别

通过使用 Bio-Bert 模型进行实体标记，我们的模型在医疗领域的数据集上取得显著的性能提升。

Dec, 2020

多模态转换器：将临床记录与结构化电子病历数据融合，可解释的住院死亡率预测

本论文提出一个新型的多模态变压器，用于融合医疗记录数据和医生的述职记录来预测住院死亡率，并使用可视化方法展示关键的医疗记录和医疗数据特征，进而提高了诊断的可解释性和预测的精度。

Aug, 2022

基于纵向结构化电子健康记录的氯吡格雷治疗失败的检测与预测

我们提出机器学习算法，利用纵向结构化的电子健康记录（EHR）自动检测和预测氯吡格雷治疗的失败。通过将自然语言和结构化 EHR 进行类比，我们引入了自然语言处理（NLP）应用中使用的各种机器学习算法来构建处理失败检测和预测的模型。在此方面，我们从英国生物库中生成了一个患有氯吡格雷处方的患者队列，并注释了患者在首次氯吡格雷处方的一年内是否发生处理失败事件；在 502,527 名患者中，1,824 名患者被确定为处理失败病例，6,859 名患者被视为对照病例。从数据集中，我们将患者的诊断、处方和程序记录整合到相同日期的访问中来构建模型。模型为两个不同的任务，即检测和预测构建，实验结果显示在这两个任务中，时间序列模型优于词袋方法。特别是，一种基于 Transformer 的模型，即 BERT，在检测任务中可达到 0.928 的 AUC，而在预测任务中可达到 0.729 的 AUC。当没有足够的训练数据时，BERT 还显示出优势，因为它利用使用大量未标记数据的预训练过程。

Oct, 2023

适应预训练语言模型以解决电子病历中的表格预测问题

本文提出了一种使用域适应来适应 DeBERTa 模型用于电子医疗记录任务的方法，并在包括 MIMIC-III 出院摘要和 PubMed 摘要在内的数据集上对其进行预训练。结果表明，该方法在紧急部门结果的三项基准测试任务中表现优于其他模型，并使用描述性列名来提高性能。

Mar, 2023