Feb, 2022

评估临床试验中上下文表征在检测结果短语中的作用

TL;DR使用机器学习自动识别临床试验结果具有加快医疗决策所需证据获取的潜力,但先前研究认为缺乏训练语料库是结果检测任务面临的挑战。本文介绍了一个专家注释的临床结果数据集 EBM-COMET,可以在无关于任意结果分类的前提下,使用最近发布的分类法将结果标准化,通过使用多种预训练的语境化表示方法和一个基于临床信息的 Part-Of-Speech 嵌入加权损失函数的神经模型提取结果,本文取得了 81.5% F1 的最佳模型表现,超越了原 EBM-NLP 数据集的领先成绩。