创建一个西班牙放射学报告标注语料库
介绍了一个包含 609 个注释放射学报告的语料库,用于医学影像诊断,利用两种基于 BERT 的架构,提取事件信息和规范化概念,为二次应用提供结构化的语义表示。
Mar, 2024
本文介绍了 RadGraph 数据集,这是一个基于新的信息提取模式设计的全文胸部 X 射线放射学报告中实体与关系的数据集。作者还发布了与之相关的开发、测试和推理数据集,并训练了一个深度学习模型 ——RadGraph Benchmark,该模型在 MIMIC-CXR 和 CheXpert 测试集上分别达到 0.82 和 0.73 的微 F1 得分。这些数据集可用于医疗自然语言处理、计算机视觉和多模态学习等领域的研究。
Jun, 2021
通过使用 RadGraph 奖励提出了一种基于胸透领域实体和实体关系的新方法,以进一步提高放射学报告的实际完成和正确性,该方法显着改善了放射学报告生成效果。
Oct, 2022
该研究介绍了一种名为 Radiological Report Evaluation (RaTEScore) 的新型、面向实体的度量标准,用于评估由人工智能模型生成的医学报告的质量。RaTEScore 强调诊断结果和解剖细节等重要医学实体,并且对于复杂的医学近义词和否定表达式具有鲁棒性。该度量标准通过比较从语言模型中获得的实体嵌入的相似性,根据其类型和与临床重要性的相关性来衡量。我们的评估结果显示,RaTEScore 与人类偏好更加一致,这一点在现有的公开基准和我们新提出的 RaTE-Eval 基准上得到了验证。
Jun, 2024
该研究提出了一种基于深度学习自然语言处理的方法,通过从放射学报告中提取空间信息,包括放射学发现、解剖位置、可能诊断以及相关避免使用术语等,从而为诊断提供详细信息。
Aug, 2019
本文提出了一种基于模板的方法,通过使用多标签图像分类器,变换器模型和 BERT 多标签文本分类器,还有规则系统从放射学图像中生成放射学报告,并在实验中通过 IU Chest X-ray 和 MIMIC-CXR 数据集表现出比现有技术模型更好的性能。
Jun, 2023
采用深度神经模型,结合命名实体识别,并参考葡萄牙肿瘤研究所的专家意见,文中提出了一种从欧洲葡萄牙语癌症病历中提取手术程序,药物和疾病的策略,并取得了较好的性能表现。
Apr, 2023
本文利用 BERT 模型在无标注大语料库中预训练生成上下文表示,进而构建医学无标注文本的自监督学习模型提高判别医学报告的信息提示等级,并取得了显著性能优于 Word2vec 模型的效果。
Dec, 2019
该研究提供了一份 5000 份医学文章摘要的标注语料库,其中的标注包括描述人口、干预方法及比较、以及测量结果等关键信息,旨在协助检索医学文献并支持循证医学实践。
Jun, 2018
本研究提出了一种基于文本属性的整合方法,包括三个模型:聚焦句模型、周围上下文模型和格式 / 布局模型,采用双向 LSTMs 和句子编码来获取上下文,结合多个特征和报告结构进行自动标注,取得了相对于其他方法来说更好的 97.1% 精度。
Oct, 2020