解锁深度 PICO 提取的力量:逐步医学实体识别
本文提出并测试了一种新的 PICO 区间检测方法,该方法不需要标注的区间数据,仅使用众包句子级注释来实现。该方法有助于将低质量众包和句子级 PICO 注释转化为可用于快速分配临床试验的结构化信息,并提高临床试验的回收率,减少了系统性回顾的时间。
Sep, 2021
PICOX 通过识别开始和结束实体的单词,并使用多标签分类器将一个或多个 PICO 标签分配给跨度候选项,从而优于基线方法,在多个数据集上表现出更高的精确度、召回率和 F1 得分,并通过数据增强策略有效地减少了误报,提高了精确度。
Jan, 2024
该研究提供了一份 5000 份医学文章摘要的标注语料库,其中的标注包括描述人口、干预方法及比较、以及测量结果等关键信息,旨在协助检索医学文献并支持循证医学实践。
Jun, 2018
研究人员利用自动化文本挖掘技术,设计了一种针对医学研究文章关键词自动识别及网络提取的全流程解决方案,可在大规模的 PubMed 和 CORD-19 数据库上快速检索有关 COVID-19 和其他医学研究的相关实体,并生成实体列表及图表。
Apr, 2023
本研究探究了一种新的人口、干预和结果(PIO)元素检测方法,特别关注证据医学(EBM)中的这一任务。本研究目的是建立一个训练数据集,以便最大限度地减少冗余和歧义,并探讨利用最先进的嵌入方法进行 PIO 元素检测的可能选项。我们利用最先进的文本嵌入 BERT 建立了一个多标签分类器,这进一步优化了分类器的性能,同时表明模型可以通过使用集成方法和提升技术来提高。
Jun, 2019
该研究创建了第一个意大利神经心理学命名实体识别数据集,PsyNIT,并使用它开发了用于此任务的大型语言模型。通过多中心模型实验,建立了方法论指导,未来还可为意大利医院提供重要的研究机会。
Jun, 2023
该研究提供了一个医学信息提取的工程框架,其中包括医疗实体识别、关系提取和属性提取。通过深度学习技术和注释语料库,该系统可以高准确率地提取医学实体、关系和属性。
Mar, 2022
本文研究了由多个人工标注员(包括专家和非专家)进行的 PICO 注释的一致性,并发现个体标注员的注释边界非常多样化,认为仅使用标准协议可能会削弱 PICO 跨度的一致性,同时采用标准和宽松协议更适用于 PICO 跨度评估。
Apr, 2019
本研究在仅有 10 个注释示例的情况下,通过使用预训练权重、超参数调整、预处理数据、自定义词嵌入和优化词外词汇等 5 个因素改善了命名实体识别任务,并将其 F1 得分从 69.3% 提高到 78.87%。
Nov, 2018
通过在 Apache Spark 之上重新实现 Bi-LSTM-CNN-Char 深度学习架构,我们提出了一个单可训练的命名实体识别(NER)模型,该模型在七个公共生物医学基准测试中获得了新的最优结果,而不使用像 BERT 这样的重型上下文嵌入。该模型在生产级别代码库中作为开源 Spark NLP 库的一部分免费提供,并且可以扩展以支持其他人类语言,而不需要更改代码。
Nov, 2020