A-Eval: 胸腔多器官分割跨数据集评估基准
介绍了 AMOS 数据集,用于细分包含多个器官的腹部 CT/MRI 图像,并对该数据集上使用的多种深度学习模型进行了基准测试。
Jun, 2022
深度学习在腹部多器官分割方面取得了巨大的进展,但在边缘情况和复杂器官上的鲁棒性仍然是一个具有挑战性的问题。为了调查模型的鲁棒性,我们收集并注释了 RAOS 数据集,包括 413 名患者的 413 个 CT 扫描,涵盖了诊断 / 放疗、部分切除和完全切除三个临床组。该数据集可以作为评估模型鲁棒性的潜在基准,并提供了一些在公共数据集中很难获取的器官。我们对几种最先进的方法在这三个临床组中进行了基准测试,评估了性能和鲁棒性,并评估了 RAOS 与三个公共数据集之间的交叉泛化能力。该数据集和综合分析为未来鲁棒性研究提供了一个潜在的基准。
Jun, 2024
该论文介绍了一个大规模的腹部 CT 器官分割数据集 AbdomenCT-1K,其中包括来自 12 个医疗中心的 1000 多个 CT 扫描,并指出现有的分割方法在不同医疗中心、不同阶段和看不见的疾病上存在一定的局限性,提出了用于此类数据的四个器官分割基准以及针对这些基准的简单而有效的方法,这将有助于未来的医学影像研究。
Oct, 2020
为了促进医疗语言模型的发展,本文介绍了一个多层次、多任务和多领域的医疗基准数据集 MedEval,包含来自多个医疗系统的数据,跨越了 8 种检查模式的 35 个人体区域。我们对 10 个通用和领域特定的语言模型进行了系统评估,并发现语言模型在不同任务上的效果不同。同时,我们强调了对少样本使用大型语言模型进行指导调整的重要性。研究结果为医疗领域的语言模型基准测试提供了参考,并深入探讨了采用大型语言模型在医疗领域的优势和局限性,为其实际应用和未来发展提供了重要启示。
Oct, 2023
定量器官评估是自动腹部疾病诊断和治疗规划的重要步骤。人工智能(AI)在自动化这一过程中显示出巨大的潜力。为了克服现有 AI 算法在现实世界多国家设置中对准确性和效率的大规模评估以及缺乏全面评估的限制,我们组织了迄今最大规模的腹部器官分析挑战 FLARE 2022 Challenge,旨在评估快速、低资源、准确、注释高效和泛化能力强的 AI 算法。我们从 50 多个医疗团体构建了一个跨洲际和跨国家的数据集,包括来自不同种族、疾病、阶段和制造商的计算机断层扫描(CT 扫描)。我们独立验证了一组 AI 算法通过使用 50 个标记扫描和 2000 个未标记扫描实现了 90.0% 的中位数 Dice 相似系数(DSC),这可以显著减少标注要求。最佳表现的算法成功泛化到保留的外部验证集,分别在北美、欧洲和亚洲队列上实现了中位数 DSC 分别为 89.5%、90.9% 和 88.3%。它们还实现了关键器官生物学特征的自动提取,这在传统的手动测量中需要耗费大量人力。这有望利用未标记数据提升性能并缓解现代 AI 模型的标注短缺问题。
Aug, 2023
本文通过跨数据集设置,对 11 种代表性的文本摘要模型在不同领域的 5 个数据集上的性能进行了深入分析,揭示了模型的架构和生成方式(抽象和抽取),以及预训练的嵌入式知识对模型泛化能力的影响。
Oct, 2020
本文提出了一种用于连续器官和肿瘤分割任务的创新结构,包括一系列轻量级的、类特定的输出头,以及将对比语言 - 图像预训练嵌入到器官特定的头中。实验结果表明该方法在学习过程中提高了基线神经网络对新引入和先前学习类别的分割性能。
Jun, 2023
本文介绍了机器学习在人腹部器官分类中的应用,通过分析深度学习模型在肝脏和全部器官的单模态(CT / MR)和异模态任务上的性能表现,在多个任务中有不同表现。
Jan, 2020
本文提出了一个新的基于模型适应和模型融合的双阶段方法,该方法利用现成的单器官分割模型来开发适用于目标数据集的多器官分割模型,从而消除了多器官分割中对有标注数据依赖的问题。实验结果表明,此方法可以有效地利用现成的单器官分割模型来获得高准确度的多器官分割模型。
Apr, 2023
在这项研究中,我们提出了使用半监督学习和迭代伪标签策略来解决 FLARE23 挑战,在通过完整器官注释数据集训练的深度模型 (nn-UNet) 生成伪标签后,在 FLARE23 数据集上,我们的方法在器官分割和肿瘤分割上取得了优秀的结果。
Oct, 2023