创建一个西班牙放射学报告标注语料库

ACLOct, 2017

创建一个西班牙放射学报告标注语料库

Creation of an Annotated Corpus of Spanish Radiology Reports

Viviana Cotik, Darío Filippo, Roland Roller, Hans Uszkoreit, Feiyu Xu

TL;DR本研究提供了一个包含 513 份西班牙语放射学报告的新匿名化注释语料库，手动标注了实体、否定与不确定性术语和关系，该语料库可作为命名实体识别和关系提取算法的评估资源和监督方法的输入，并为其他研究人员提供指导。

Abstract

This paper presents a new annotated corpus of 513 anonymized radiology reports written in Spanish. Reports were manually annotated with entities, negation and uncertainty terms and relations. The corpus was conceived as an evaluation resource for →

annotated corpus radiology reports named entity recognition relation extraction biomedical resource

发现论文，激发创造

基于 BERT 语言模型的标注医学影像报告和信息提取结果的新语料库

介绍了一个包含 609 个注释放射学报告的语料库，用于医学影像诊断，利用两种基于 BERT 的架构，提取事件信息和规范化概念，为二次应用提供结构化的语义表示。

Mar, 2024

从影像学报告中提取临床实体和关系的 RadGraph

本文介绍了 RadGraph 数据集，这是一个基于新的信息提取模式设计的全文胸部 X 射线放射学报告中实体与关系的数据集。作者还发布了与之相关的开发、测试和推理数据集，并训练了一个深度学习模型 ——RadGraph Benchmark，该模型在 MIMIC-CXR 和 CheXpert 测试集上分别达到 0.82 和 0.73 的微 F1 得分。这些数据集可用于医疗自然语言处理、计算机视觉和多模态学习等领域的研究。

Jun, 2021

通过语义奖励提高放射科报告生成的事实正确性

通过使用 RadGraph 奖励提出了一种基于胸透领域实体和实体关系的新方法，以进一步提高放射学报告的实际完成和正确性，该方法显着改善了放射学报告生成效果。

Oct, 2022

RaTEScore: 放射学报告生成的度量标准

该研究介绍了一种名为 Radiological Report Evaluation (RaTEScore) 的新型、面向实体的度量标准，用于评估由人工智能模型生成的医学报告的质量。RaTEScore 强调诊断结果和解剖细节等重要医学实体，并且对于复杂的医学近义词和否定表达式具有鲁棒性。该度量标准通过比较从语言模型中获得的实体嵌入的相似性，根据其类型和与临床重要性的相关性来衡量。我们的评估结果显示，RaTEScore 与人类偏好更加一致，这一点在现有的公开基准和我们新提出的 RaTE-Eval 基准上得到了验证。

Jun, 2024

深度学习在胸部 X-Ray 报告中理解空间语言的表示框架，标注和空间关系提取

该研究提出了一种基于深度学习自然语言处理的方法，通过从放射学报告中提取空间信息，包括放射学发现、解剖位置、可能诊断以及相关避免使用术语等，从而为诊断提供详细信息。

Aug, 2019

替换和报告：基于自然语言处理的放射学报告生成

本文提出了一种基于模板的方法，通过使用多标签图像分类器，变换器模型和 BERT 多标签文本分类器，还有规则系统从放射学图像中生成放射学报告，并在实验中通过 IU Chest X-ray 和 MIMIC-CXR 数据集表现出比现有技术模型更好的性能。

Jun, 2023

一种用于葡萄牙语肿瘤健康记录的生物医学实体提取流水线

采用深度神经模型，结合命名实体识别，并参考葡萄牙肿瘤研究所的专家意见，文中提出了一种从欧洲葡萄牙语癌症病历中提取手术程序，药物和疾病的策略，并取得了较好的性能表现。

Apr, 2023

自监督上下文语言表征用于放射学报告，以提高通信紧急性识别

本文利用 BERT 模型在无标注大语料库中预训练生成上下文表示，进而构建医学无标注文本的自监督学习模型提高判别医学报告的信息提示等级，并取得了显著性能优于 Word2vec 模型的效果。

Dec, 2019

一个包含多层病人、干预和结果注释的语料库，以支持医学文献语言处理

该研究提供了一份 5000 份医学文章摘要的标注语料库，其中的标注包括描述人口、干预方法及比较、以及测量结果等关键信息，旨在协助检索医学文献并支持循证医学实践。

Jun, 2018

自动构建放射学报告的集成方法

本研究提出了一种基于文本属性的整合方法，包括三个模型：聚焦句模型、周围上下文模型和格式 / 布局模型，采用双向 LSTMs 和句子编码来获取上下文，结合多个特征和报告结构进行自动标注，取得了相对于其他方法来说更好的 97.1% 精度。

Oct, 2020