评估临床试验中上下文表征在检测结果短语中的作用

Feb, 2022

评估临床试验中上下文表征在检测结果短语中的作用

Assessment of contextualised representations in detecting outcome phrases in clinical trials

Micheal Abaho, Danushka Bollegala, Paula R Williamson, Susanna Dodd

TL;DR使用机器学习自动识别临床试验结果具有加快医疗决策所需证据获取的潜力，但先前研究认为缺乏训练语料库是结果检测任务面临的挑战。本文介绍了一个专家注释的临床结果数据集 EBM-COMET，可以在无关于任意结果分类的前提下，使用最近发布的分类法将结果标准化，通过使用多种预训练的语境化表示方法和一个基于临床信息的 Part-Of-Speech 嵌入加权损失函数的神经模型提取结果，本文取得了 81.5% F1 的最佳模型表现，超越了原 EBM-NLP 数据集的领先成绩。

Abstract

Automating the recognition of outcomes reported in clinical trials using machine learning has a huge potential of speeding up access to evidence necessary in healthcare decision-making. Prior research has however

clinical trials machine learning outcome detection contextualized representations ebm-comet

发现论文，激发创造

利用上下文嵌入增强临床概念抽取

本研究旨在研究新的语言表示方法（如 ELMo，BERT）在医疗概念提取方面的应用，比较这些方法与传统词嵌入方法（word2vec，GloVe，fastText）的性能表现，并探讨将这些表示方法应用于医疗任务的可能性。研究结果表明，基于大型医学语料库的上下文嵌入方法表现出色，优于现有所有方法。此外，与传统词表示相比，上下文嵌入方法还包含有价值的语义信息。

Feb, 2019

公开可用的临床 BERT 嵌入

本文探讨了基于词汇的上下文嵌入模型在临床领域的应用，发现相对于通用语料库，专业领域语料库下的 BERT 模型在三个典型的临床自然语言处理任务上表现更加出色。

Apr, 2019

基于上下文词嵌入的临床概念抽取

本研究提出一个基于领域特定词汇上下文嵌入的临床问题、治疗和测试自动标注临床笔记的模型，使用上下文嵌入模型训练一个双向 LSTM-CRF 模型用于临床概念提取，并在 I2B2 2010 挑战数据集上进行了测试，最终性能优于现有模型 3.4%。

Oct, 2018

使用自我监督知识融合从入院记录中预测临床结果

该研究旨在通过临床文本的预测，预防医生忽略潜在风险并帮助医院规划能力。使用语言模型分析预测诊断结果、手术、住院死亡率和住院时间。提出了临床结局预训练来整合多个公共来源的患者结局知识，并提出了一种将 ICD 编码层次结构纳入模型的简单方法，以提高模型的性能和可迁移性，同时也揭示了模型的一些缺陷。

Feb, 2021

Med-BERT: 基于大规模结构化电子病历的预训练上下文化嵌入，用于疾病预测

Med-BERT 是一种基于 BERT 框架训练的语境嵌入模型，适用于在数据集较小的情况下预测疾病。通过电子病历研究心力衰竭和胰腺癌的预测，表明 Med-BERT 具有较高的准确性和泛化性能，可以大幅提升深度学习模型的性能和推广医疗人工智能的发展。

May, 2020

基于大型语言模型的多模态临床试验结果预测

临床试验结果预测的多模态融合专家模型（LIFTED）通过将各种方式的数据转化为自然语言描述，再利用统一的噪声抵抗编码器提取信息，进一步利用稀疏的专家模型优化表示，通过动态集成不同方式的表示进行预测，有效提升临床试验结果预测性能。

Feb, 2024

UmlsBERT: 使用统一医学语言系统词表增强上下文嵌入的临床领域知识

UmlsBERT is a contextual embedding model for biomedical natural language processing that integrates domain knowledge during pre-training via a novel knowledge augmentation strategy, outperforming existing models on named-entity recognition and clinical natural language inference tasks.

Oct, 2020

从语言模型中探测生物医学嵌入

本文研究使用预训练的语言模型作为固定的特征提取器，并限制下游任务模型没有额外的序列建模层，探索在域内训练后的上下文词嵌入中携带的附加信息。结果发现，BioELMo 在编码实体类型和关系信息方面优于 BioBERT。

Apr, 2019

通过隐性证据集成预测临床试验结果

为了优化临床试验的设计，我们提出了一种新的临床试验结果预测（CTRP）任务，并利用大规模非结构化结构的医学文献中的语句隐含地包含 PICO 和结果的证据，预训练模型在下游数据集上进行微调得到更好的表现，针对 COVID-19 的另一个数据集也验证了性能提升。

Oct, 2020

基于临床记录抽取的不同表征模型评估死亡率预测

本研究基于 Transformers 预训练的语言表示学习方法，将特定医学记录中的信息提取，映射到标准词汇中，并在医院死亡预测任务中测试不同输入格式的性能，结果表明使用提取的唯一概念和标准名称作为输入可以获得更好的性能。

Jul, 2022