A-Eval: 胸腔多器官分割跨数据集评估基准

Sep, 2023

A-Eval: 胸腔多器官分割跨数据集评估基准

A-Eval: A Benchmark for Cross-Dataset Evaluation of Abdominal Multi-Organ Segmentation

Ziyan Huang, Zhongying Deng, Jin Ye, Haoyu Wang, Yanzhou Su...

TL;DR通过对深度学习在腹部多器官分割中的应用进行研究，本文提出了 A-Eval 方法，利用四个大型公共数据集和一个 BTCV 数据集构建了 A-Eval 基准测试。通过对各种不同数据使用场景进行评估，我们强调了有效数据使用对提高模型泛化能力的重要性，为构建大型数据集和改进训练策略提供了宝贵的见解。

Abstract

Although deep learning have revolutionized abdominal multi-organ segmentation, models often struggle with generalization due to training on small, specific datasets. With the recent emergence of →

deep learning abdominal multi-organ segmentation generalization large-scale datasets data usage

发现论文，激发创造

AMOS: 用于多样化医学图像分割的大规模腹部多器官基准

介绍了 AMOS 数据集，用于细分包含多个器官的腹部 CT/MRI 图像，并对该数据集上使用的多种深度学习模型进行了基准测试。

Jun, 2022

临床情境中的腹部器官分割重思（RAOS）：具有挑战性案例的鲁棒性评估基准

深度学习在腹部多器官分割方面取得了巨大的进展，但在边缘情况和复杂器官上的鲁棒性仍然是一个具有挑战性的问题。为了调查模型的鲁棒性，我们收集并注释了 RAOS 数据集，包括 413 名患者的 413 个 CT 扫描，涵盖了诊断 / 放疗、部分切除和完全切除三个临床组。该数据集可以作为评估模型鲁棒性的潜在基准，并提供了一些在公共数据集中很难获取的器官。我们对几种最先进的方法在这三个临床组中进行了基准测试，评估了性能和鲁棒性，并评估了 RAOS 与三个公共数据集之间的交叉泛化能力。该数据集和综合分析为未来鲁棒性研究提供了一个潜在的基准。

Jun, 2024

AbdomenCT-1K：腹部器官分割问题已得解决吗？

该论文介绍了一个大规模的腹部 CT 器官分割数据集 AbdomenCT-1K，其中包括来自 12 个医疗中心的 1000 多个 CT 扫描，并指出现有的分割方法在不同医疗中心、不同阶段和看不见的疾病上存在一定的局限性，提出了用于此类数据的四个器官分割基准以及针对这些基准的简单而有效的方法，这将有助于未来的医学影像研究。

Oct, 2020

MedEval：多层次、多任务、多领域的医学文本模型评估基准

为了促进医疗语言模型的发展，本文介绍了一个多层次、多任务和多领域的医疗基准数据集 MedEval，包含来自多个医疗系统的数据，跨越了 8 种检查模式的 35 个人体区域。我们对 10 个通用和领域特定的语言模型进行了系统评估，并发现语言模型在不同任务上的效果不同。同时，我们强调了对少样本使用大型语言模型进行指导调整的重要性。研究结果为医疗领域的语言模型基准测试提供了参考，并深入探讨了采用大型语言模型在医疗领域的优势和局限性，为其实际应用和未来发展提供了重要启示。

Oct, 2023

FLARE22 挑战赛：在全癌症腹部器官定量中释放未标记数据的优势

定量器官评估是自动腹部疾病诊断和治疗规划的重要步骤。人工智能（AI）在自动化这一过程中显示出巨大的潜力。为了克服现有 AI 算法在现实世界多国家设置中对准确性和效率的大规模评估以及缺乏全面评估的限制，我们组织了迄今最大规模的腹部器官分析挑战 FLARE 2022 Challenge，旨在评估快速、低资源、准确、注释高效和泛化能力强的 AI 算法。我们从 50 多个医疗团体构建了一个跨洲际和跨国家的数据集，包括来自不同种族、疾病、阶段和制造商的计算机断层扫描（CT 扫描）。我们独立验证了一组 AI 算法通过使用 50 个标记扫描和 2000 个未标记扫描实现了 90.0% 的中位数 Dice 相似系数（DSC），这可以显著减少标注要求。最佳表现的算法成功泛化到保留的外部验证集，分别在北美、欧洲和亚洲队列上实现了中位数 DSC 分别为 89.5%、90.9% 和 88.3%。它们还实现了关键器官生物学特征的自动提取，这在传统的手动测量中需要耗费大量人力。这有望利用未标记数据提升性能并缓解现代 AI 模型的标注短缺问题。

Aug, 2023

CDEvalSumm：神经摘要系统跨数据集评估的实证研究

本文通过跨数据集设置，对 11 种代表性的文本摘要模型在不同领域的 5 个数据集上的性能进行了深入分析，揭示了模型的架构和生成方式（抽象和抽取），以及预训练的嵌入式知识对模型泛化能力的影响。

Oct, 2020

腹部多器官和肿瘤分割的持续学习

本文提出了一种用于连续器官和肿瘤分割任务的创新结构，包括一系列轻量级的、类特定的输出头，以及将对比语言 - 图像预训练嵌入到器官特定的头中。实验结果表明该方法在学习过程中提高了基线神经网络对新引入和先前学习类别的分割性能。

Jun, 2023

CHAOS 挑战 -- 联合（CT-MR）健康腹部器官分割

本文介绍了机器学习在人腹部器官分类中的应用，通过分析深度学习模型在肝脏和全部器官的单模态（CT / MR）和异模态任务上的性能表现，在多个任务中有不同表现。

Jan, 2020

模型适应和集成的个性化多器官分割

本文提出了一个新的基于模型适应和模型融合的双阶段方法，该方法利用现成的单器官分割模型来开发适用于目标数据集的多器官分割模型，从而消除了多器官分割中对有标注数据依赖的问题。实验结果表明，此方法可以有效地利用现成的单器官分割模型来获得高准确度的多器官分割模型。

Apr, 2023

腹部器官和肿瘤分割的迭代半监督学习

在这项研究中，我们提出了使用半监督学习和迭代伪标签策略来解决 FLARE23 挑战，在通过完整器官注释数据集训练的深度模型 (nn-UNet) 生成伪标签后，在 FLARE23 数据集上，我们的方法在器官分割和肿瘤分割上取得了优秀的结果。

Oct, 2023