CARE:从临床文献中提取实验结果
我们提出了一种名为 CARE 的 Co-Attention 网络模型,可以实现联合实体和关系的抽取任务,通过学习各个子任务的独立表示以避免特征重叠,并通过双向交互来提升模型性能,实验结果表明我们的模型在三个基准数据集上表现优秀。
Aug, 2023
该文介绍了一种文本挖掘框架,利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理,取得优异的实验结果,并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。
Dec, 2021
本文介绍了一个人工标注的可解释因果推理数据集(e-CARE),包含超过 21K 个因果推理问题以及自然语言形成的解释。实验结果表明,为因果事实生成有效解释仍然是现有模型面临的难题,而解释信息有助于提高因果推理模型的准确性和稳定性。
May, 2022
该文详述了建立科学声明数据集 SciClaim 和使用基于 Transformer 的方法对其进行关系提取,该数据集具有细粒度的节点和边的标注,包括修饰实体和关系的细粒度属性。实验性变量关系包括因果、比较、预测、统计和比例关系的相关信息贯穿全文,并探讨了细粒度知识图谱在科学声明及其他领域中的应用前景。
Sep, 2021
CCS Explorer 是一个端到端的系统,可从 CCS 中提取相关信息以总结文章,以生物 BERT 为基础的句子相关性预测可达到 80.2%召回率和 0.843 的 AUC-ROC,以 PubMedBERT 为基础的患者,干预措施,结果检测的平均微 F1 分数为 77.8%,可节省近 660 倍的时间。
Nov, 2022
该研究提供了一个医学信息提取的工程框架,其中包括医疗实体识别、关系提取和属性提取。通过深度学习技术和注释语料库,该系统可以高准确率地提取医学实体、关系和属性。
Mar, 2022
介绍了一个 230k 的社交媒体帖子数据集 CARE$_{db}$,通过 Common Affective Response(CARE)方法进行标注,旨在预测社交媒体帖子在用户中引起的情感反应,并使用该数据集训练基于 BERT 的模型预测情感反应以及情感检测。
Jan, 2022
本文讨论如何利用 NLP 技术快速分析大量的疾病治疗相关的文章,以便于有效地整理出临床试验结果,并希望以此为基础构建出一个比较不同治疗方法的数据库,方便医生进行治疗决策。同时,本文还介绍了一个被称为 Evidence Inference 的公开数据集,该数据集包括了很多描述临床试验的文献,可以用于相关研究。
May, 2020
本文提出了一个多实体类型和多关系对的文献级生物医学关系抽取数据集 BioRED,包括新发现和先前已知的信息,旨在评估现有状态下的自动化算法,为更准确、高效和稳健的生物医学关系系统的开发奠定基础。
Apr, 2022
本研究提出了内联注释作为基于 AI 的阅读辅助的自然载体,并提供了 CARE—— 第一个用于内联注释和阅读研究的开放集成平台。该平台可以收集内联评论数据,在普通协作阅读环境中提高阅读效果,并提供 NLP-based assistance 的能力。我们通过一项用户研究,评估了 CARE 在学术同行评审中的应用,证明了该平台的功效。我们欢迎研究者探索并基于 CARE 的开源实现进行构建。
Feb, 2023