解锁深度 PICO 提取的力量：逐步医学实体识别

Apr, 2020

解锁深度 PICO 提取的力量：逐步医学实体识别

Unlocking the Power of Deep PICO Extraction: Step-wise Medical NER Identification

Tengteng Zhang, Yiqin Yu, Jing Mei, Zefang Tang, Xiang Zhang...

TL;DR提出了一种基于疾病命名实体识别的 PICO 方法，使用深度学习模型从医学文献中提取出句子并将其分类，并在此基础上识别并分类出 P 和 O，并且通过实验结果展示了该方法可以取得比传统 PICO 提取方法更高的性能和细粒度的提取结果。

Abstract

The pico framework (Population, Intervention, Comparison, and Outcome) is usually used to formulate evidence in the medical domain. The major task of PICO extraction is to extract sentences from medical literature

pico framework dner extraction deep learning frameworks fine-grained extraction results medical literature

发现论文，激发创造

在医学文本中提取 PICO 时不借助 Span 注解的 Span 检测方法

本文提出并测试了一种新的 PICO 区间检测方法，该方法不需要标注的区间数据，仅使用众包句子级注释来实现。该方法有助于将低质量众包和句子级 PICO 注释转化为可用于快速分配临床试验的结构化信息，并提高临床试验的回收率，减少了系统性回顾的时间。

Sep, 2021

从 RCT 出版物中提取重叠的 PICO 实体的基于 Span 的模型

PICOX 通过识别开始和结束实体的单词，并使用多标签分类器将一个或多个 PICO 标签分配给跨度候选项，从而优于基线方法，在多个数据集上表现出更高的精确度、召回率和 F1 得分，并通过数据增强策略有效地减少了误报，提高了精确度。

Jan, 2024

一个包含多层病人、干预和结果注释的语料库，以支持医学文献语言处理

该研究提供了一份 5000 份医学文章摘要的标注语料库，其中的标注包括描述人口、干预方法及比较、以及测量结果等关键信息，旨在协助检索医学文献并支持循证医学实践。

Jun, 2018

EasyNER：针对医学文本的可定制化、易于使用的基于深度学习和词典的命名实体识别管线

研究人员利用自动化文本挖掘技术，设计了一种针对医学研究文章关键词自动识别及网络提取的全流程解决方案，可在大规模的 PubMed 和 CORD-19 数据库上快速检索有关 COVID-19 和其他医学研究的相关实体，并生成实体列表及图表。

Apr, 2023

利用上下文嵌入增强医学文本中 PIO 元素的检测

本研究探究了一种新的人口、干预和结果（PIO）元素检测方法，特别关注证据医学（EBM）中的这一任务。本研究目的是建立一个训练数据集，以便最大限度地减少冗余和歧义，并探讨利用最先进的嵌入方法进行 PIO 元素检测的可能选项。我们利用最先进的文本嵌入 BERT 建立了一个多标签分类器，这进一步优化了分类器的性能，同时表明模型可以通过使用集成方法和提升技术来提高。

Jun, 2019

大语言模型推进意大利生物医学信息提取：方法论洞见与多中心实际应用

该研究创建了第一个意大利神经心理学命名实体识别数据集，PsyNIT，并使用它开发了用于此任务的大型语言模型。通过多中心模型实验，建立了方法论指导，未来还可为意大利医院提供重要的研究机会。

Jun, 2023

面向中文临床文本的医疗信息标注和提取统一框架

该研究提供了一个医学信息提取的工程框架，其中包括医疗实体识别、关系提取和属性提取。通过深度学习技术和注释语料库，该系统可以高准确率地提取医学实体、关系和属性。

Mar, 2022

PICO 跨度标注中的一致性研究

本文研究了由多个人工标注员（包括专家和非专家）进行的 PICO 注释的一致性，并发现个体标注员的注释边界非常多样化，认为仅使用标准协议可能会削弱 PICO 跨度的一致性，同时采用标准和宽松协议更适用于 PICO 跨度评估。

Apr, 2019

医疗文本中的少样本命名实体识别

本研究在仅有 10 个注释示例的情况下，通过使用预训练权重、超参数调整、预处理数据、自定义词嵌入和优化词外词汇等 5 个因素改善了命名实体识别任务，并将其 F1 得分从 69.3% 提高到 78.87%。

Nov, 2018

大规模生物医学命名实体识别

通过在 Apache Spark 之上重新实现 Bi-LSTM-CNN-Char 深度学习架构，我们提出了一个单可训练的命名实体识别（NER）模型，该模型在七个公共生物医学基准测试中获得了新的最优结果，而不使用像 BERT 这样的重型上下文嵌入。该模型在生产级别代码库中作为开源 Spark NLP 库的一部分免费提供，并且可以扩展以支持其他人类语言，而不需要更改代码。

Nov, 2020