文献增强的临床结果预测
该研究旨在通过临床文本的预测,预防医生忽略潜在风险并帮助医院规划能力。使用语言模型分析预测诊断结果、手术、住院死亡率和住院时间。提出了临床结局预训练来整合多个公共来源的患者结局知识,并提出了一种将 ICD 编码层次结构纳入模型的简单方法,以提高模型的性能和可迁移性,同时也揭示了模型的一些缺陷。
Feb, 2021
该研究调查了树模型在长期死亡预测上的表现,并研究了两种近期引入的生物标志物对长期死亡的影响。研究采用来自中国台湾卫生福利部的 CCHIA 公开数据,以及从 139 例急性心肌梗死患者收集的医学和人口统计学数据,使用先进的集成树模型算法预测了 14 年内的全因死亡率,并发现添加生物标志物后算法的性能有所提高,可更好地为高风险个体确定治疗优先级。
Mar, 2024
利用聚合集成的大型语言模型的新方法,能够保留长篇临床文本的知识,改善大型语言模型在处理长篇输入和多样化数据集时的性能,并在预测临床结果方面取得了比基线、集成和聚合方法更好的结果。
Nov, 2023
本研究旨在探究如何利用医疗自然语言处理技术,将临床文本与结构化临床数据相结合,建立多模态神经网络模型,实现对重症监护室患者住院死亡风险的预测。研究结果显示,相较于基准模型,本模型的 AUC 值提高了 2%。
Nov, 2018
本文提出了 FINEEHR 系统,采用度量学习和微调等两种表示学习技术来优化临床记录的嵌入,以提高预测准确性。使用 MIMIC III 数据集评估 FINEEHR 的表现,结果表明两种嵌入优化方法均能提高预测准确性,同时它们的组合给出了最好的结果,平均 AUC 为 96.04%,平均 AUC-PR 为 96.48%。
Apr, 2023
使用机器学习自动识别临床试验结果具有加快医疗决策所需证据获取的潜力,但先前研究认为缺乏训练语料库是结果检测任务面临的挑战。本文介绍了一个专家注释的临床结果数据集 EBM-COMET,可以在无关于任意结果分类的前提下,使用最近发布的分类法将结果标准化,通过使用多种预训练的语境化表示方法和一个基于临床信息的 Part-Of-Speech 嵌入加权损失函数的神经模型提取结果,本文取得了 81.5% F1 的最佳模型表现,超越了原 EBM-NLP 数据集的领先成绩。
Feb, 2022
本文研究提出一种新的文本数据增强方法,利用 GPT-2 生成病人电子病历中的临床记录作为额外的训练数据,用于预测病人的不良预后,实验证明了该数据增强方法的有效性。
Nov, 2022
术后风险预测对于有效的围手术期护理管理和规划具有重要意义。本研究旨在评估临床大型语言模型(LLMs)是否能够使用各种训练策略对临床文本进行术后风险预测。使用 Barnes Jewish Hospital(BJH)系统 2018 年至 2021 年的 84,875 份记录进行主要队列研究,Beth Israel Deaconess 的 MIMIC 数据集上再现了方法。预训练的 LLMs 优于传统的词嵌入,临床 LLMs 的进一步调整改进了性能,表明基础模型具有潜在的任务无关学习峰值,对于围手术期护理中 LLMs 的泛化具有潜力。
Feb, 2024
该研究提出了一种基于文献摘要的新方法来预测临床试验干预措施的有效性。通过抽取摘要中表达干预措施有效性的句子,生成一个简洁的摘要,用于训练 BERT 分类器以预测干预措施的有效性。实验结果证明了该方法的有效性。
Apr, 2022
通过机器学习方法,我们开发并优化了一种从科学论文中提取疗效终点的框架,预测了与疗效终点相关的 25 个类别,并在测试集上取得了 96.4% 的高 F1 分数,对两个案例研究分别取得了 93.9% 和 93.7% 的分数,与科学专家的评估结果高度一致,为自动化提取临床终点的应用领域展示了巨大的潜力,以加速临床试验设计。
Nov, 2023