- 利用非规则多模态电子病历建模改进医疗预测
本论文通过手工建模和学习内插嵌入,采用分离机制建模不规则的时间序列;采用时间注意力机制,将临床记录的一系列表示为多元不规则时间序列,并采用交织注意机制跨时间步骤进行多模态融合,以整合多模态表示。结果表明,我们提出的方法在单一模态和多模态情景 - 基于规则和机器学习方法的荷兰临床文本否定词检测评估
比较了三种荷兰临床笔记中否定检测的方法,并发现基于 biLSTM 模型和 RoBERTa 模型的检测系统精准度更高,可以在临床信息检索和决策支持系统中用于标签提取。
- 使用预训练语言模型提取临床叙述中的药物变化
本文介绍了一种从临床笔记的自由文本中自动提取药物变化信息的方法,并用 Contextual Medication Event Dataset (CMED) 数据集识别药物提及。并提出了三种基于 BERT 的高性能系统来解决注释的药物变化特性 - MM临床表型跨语言知识迁移
研究跨语言知识转移策略用于非英语且领域内数据小的诊所中,证明了基于翻译方法与特定领域编码器相结合以及跨语言编码器和适配器可以超越当前最先进的方法。该研究发现这些策略对于分类罕见表型尤其有效,并建议根据具体情况选择使用哪种方法。结果表明,使用 - 基于临床记录抽取的不同表征模型评估死亡率预测
本研究基于 Transformers 预训练的语言表示学习方法,将特定医学记录中的信息提取,映射到标准词汇中,并在医院死亡预测任务中测试不同输入格式的性能,结果表明使用提取的唯一概念和标准名称作为输入可以获得更好的性能。
- 依照所见记录:临床笔记中的种族差异导致模型建议的差异
研究发现机器学习(ML)模型可以从患者病历中识别患者的种族信息,即使这些信息被删除,而人类专家则不能准确预测患者的种族信息。此外,研究还展示了在这些种族信息被删除的病历上训练的 ML 模型可能在临床治疗决策中继续保持现有的偏见。
- 利用荷兰临床笔记进行暴力风险评估的机器学习
利用临床记录进行暴力风险评估是有价值的,本研究探索传统和深度机器学习方法,使用临床记录评估精神病患的暴力风险,发现其表现与目前使用的基于问卷的方法相当,其中基于 BERTje 的深度学习模型的表现较差。
- EHRKit:面向电子健康档案文本的 Python 自然语言处理工具包
本文介绍了 EHRKit python 库,该库包含两个主要部分,MIMIC-III 特定功能和任务特定功能,通过访问 MIMIC-III NOTEEVENTS 数据并整合多个第三方库,以处理包括实体识别、文本摘要、机器翻译等 12 个 N - 应用 Transformer 集成生理时间序列和临床记录进行早期脓毒症预测
本篇研究提出了一种基于多模态 Transformer 模型的早期脓毒症预测方法,使用每位患者在 ICU 入院后 36 小时内的生理时间序列数据和临床笔记,仅利用前 12、18、24、30 和 36 小时的实验室指标、生命体征、患者特征和临床 - 利用自然语言处理对网络风险临床注释进行分类
该研究旨在找到评估临床笔记网络风险的有效方法。通过使用不同的分类器开发几个模型,发现 SVM 分类器使用 Word2Vec 特征的最大 F1 分数为 0.792,可用于识别可能包含敏感信息的区域,并用于提高临床笔记完全去识别的识别。
- 利用医疗概念丰富无监督用户嵌入
本研究提出了一种概念感知的无监督用户嵌入方法,结合来自 MIMIC-III 和 Diabetes 两个临床语料库的文本文档和医学概念,用于疾病诊断和病人特征研究等领域,实验证明该方法的性能明显优于现有的无监督方法。
- 使用自然语言处理从阿尔茨海默病患者的临床笔记中提取睡眠信息
本研究利用基于规则的自然语言处理(NLP)算法以及机器学习模型,自动从 AD 患者的临床笔记中提取包括打鼾、打盹、睡眠问题、舒适度、日间嗜睡、夜间醒来和睡眠时长等与睡眠有关的概念,结果表明该算法对所有睡眠概念都表现出最佳性能。
- 带有多答案和多焦点问题的临床提取问题回答数据集的开发
本文旨在开发一个新的数据集,用于研发和评估临床试验问题回答系统,该系统可以处理自然的多答案和多焦点问题。通过使用 2018 年国家 NLP 临床挑战(n2c2)语料库进行注释关系,包含 1 到 N、M 到 1 和 M 到 N 药品 - 事件 - EMNLP如何利用多模态电子病历数据进行更好的医学预测?
本文提出了一种从医疗电子健康系统中提取伴随临床记录的方法,并使用这些数据综合研究了不同模型和数据利用方法对于更好的医疗任务预测的影响。结果表明,我们的融合模型优于不包含临床记录的最新方法,这证明了我们的融合方法的重要性和临床注意点特征的价值 - ACLMIMICause: 从临床注释中自动提取因果关系类型的表示方法
本文提供了一个注释指南并开发出一个带有基线分数的注释语料库来识别生物医学概念之间在医疗笔记中的暗示或明确的因果关系。在医疗文本中高度的评分一致性显示了我们注释指南的质量,而提供的基线 F1 分数则为未来研究向理解医疗文本中的叙述走向奠定了方 - ACL基于 Hypernetwork 引导的多任务学习进行患者结果和零样本诊断预测
提出了一种基于超网络的方法,使用任务条件参数和多任务预测模型的系数来学习任务特定的预测并平衡多任务学习,将语义任务信息合并到模型中,以解决多任务学习中的干扰和泛化问题,并在真实世界的 MIMIC 数据库上表现出比强基线更好的多任务病人结果预 - 读、参与、编码:机器从临床笔记中预测医学编码的极限挑战
通过使用卷积神经网络(CNN)和长短期记忆(LSTM)网络,将医疗代码分配映射与卷积嵌入相连接,使用自我关注和代码标题引导注意力模块,结合基于句子排列的数据增强和随机权重平均训练,该研究提供的 Read,Attend 和 Code(RAC) - ACL临床阅读理解:emrQA 数据集的全面分析
本论文深度分析医疗领域的机器阅读理解 (CliniRC) 任务,重点关注 emrQA 数据集的缺陷及性能,证明对于未来数据集的创建需考虑利用领域知识和通用性。
- MT-Clinical BERT: 使用多任务学习扩展临床信息抽取能力的 BERT 模型
采用 Multitask-Clinical BERT 模型,可同时执行包括实体抽取、PHI 识别、语言蕴含和相似性在内的 8 种临床任务,极大减轻了信息提取系统的工程负担且表现出色。
- 临床 XLNet:建模序列化临床笔记并预测延长机械通气
通过开发新的文本表征 Clinical XLNet 利用临床笔记序列的时间信息,我们对长期机械通风预测问题进行了研究及实验,并证明 Clinical XLNet 在表现上始终优于最佳基线。