合成特权信息增强医学图像表示学习

Mar, 2024

合成特权信息增强医学图像表示学习

Synthetic Privileged Information Enhances Medical Image Representation Learning

Lucas Farndale, Chris Walsh, Robert Insall, Ke Yuan

TL;DR通过合成生成配对信息，我们证明了在医学图像分析中，与单模态（误差减少高达 4.4 倍）或真实多模态配对数据集（误差减少高达 5.6 倍）相比，表示学习可以得到显著改进。

Abstract

multimodal self-supervised representation learning has consistently proven to be a highly effective method in medical image analysis, offering strong task performance and producing biologically informed insights.

multimodal self-supervised representation learning medical image analysis paired datasets image generation methods synthetic data

发现论文，激发创造

双对抗生成网络生成的合成医学图像

该研究提出了一种基于生成对抗网络的新型双阶段流水线，用于从医学图像数据中生成合成医学图像，并开发了 SynthMed 在线数据库以促进医学图像任务的发展。

Sep, 2017

合성医学影像的质量如何？肺部超声的实证研究

通过使用生成模型中的合成训练数据，本研究提出了一个全面框架，以提高医学图像分析的模型开发效果，同时解决数据稀缺、数据不平衡和患者隐私问题。通过在各种规模的数据集上进行测试，我们展示了生成模型作为数据增广方法的优势，以及通过敌对方法保护患者隐私以及使用实际留存数据进行模型测试的新型性能指标。我们证明了使用合成数据和真实数据进行训练优于仅使用真实数据进行训练，并且仅使用合成数据进行训练的模型接近仅使用真实数据进行训练的模型。

Oct, 2023

TSynD：针对增强医学影像分类的目标合成数据生成

通过生成模型使用医学影像数据进行有针对性的合成训练数据生成，以提高图像分类的准确性和鲁棒性。

Jun, 2024

利用合成数据进行医学视觉 - 语言预训练：绕开真实图像的需求

利用合成图像从真实医学报告中生成的医学影像，可以有效地实现医学视觉与语言预训练 (VLP)，并且在图像分类、语义分割和目标检测等任务上，利用合成数据的性能与真实数据相当甚至超过。

Oct, 2023

医学图像分析的多模态自监督学习

该论文提出了一种利用多个成像模式的新型自监督方法，设计了一个多模式拼图任务以促进多种图像模式的特征表征，提出了一种利用跨模态生成技术进行多模态数据增强的方法，实验表明该方法能够提高数据效率和语义表征，广泛应用于四种不同的下游任务，并取得了领先的成果。

Dec, 2019

合成数据训练在多模态关系抽取中胜过真实数据

使用 Mutual Information-aware Multimodal Iterated Relational dAta GEneration (MI2RAGE) 方法，通过 Chained Cross-modal Generation (CCG) 促进生成数据的多样性，并利用 teacher network 选择与 ground-truth 标签具有高互信息的有价值的训练样本，相比于直接在合成数据上训练，我们观察到合成文本的 F1 得分提高了 24.06%，合成图像的 F1 得分提高了 26.42%。值得注意的是，我们最好的模型在完全合成图像上训练时，相对于在真实多模态数据上训练的现有最先进模型，在 F1 得分上提升了 3.76%。

Dec, 2023

多任务学习：从多个合成任务中学习医学异常定位

针对现实场景中实际应用领域不断增多的无泛化的外部分布，我们的新方法利用多个可视化的、不同的、合成异常学习任务进行训练和验证，从而增强了样本的鲁棒性和泛化性，实现了对基于脑部 MRI 和胸部 X 射线的最新方法的超越。

Jul, 2023

真假：通过分布匹配进行有效的训练数据合成

我们通过广泛的实验验证了我们的合成数据在各种图像分类任务中的有效性，既可以替代真实数据集，也可以作为其增强，同时也有益于挑战性任务，如超出分布的泛化和隐私保护。

Oct, 2023

利用潜在扩散模型的合成数据增强医疗图像分类器

利用潜在扩散模型生成皮肤病图像的研究表明，通过合成数据训练模型可以在数据有限的情况下提高性能，但合成数据与真实数据相比仍然有较小的性能增益，因此收集多样的真实数据仍是提升医疗人工智能算法的重要步骤。

Aug, 2023

跨域自监督多任务特征学习：使用合成图像

本文提出了一种多任务深度网络学习通用高级视觉表示的方法，并通过对人工制成的图像进行训练来克服真实与合成数据之间的领域差异，模型考虑同步从合成 RGB 图像中预测其表面法向、深度和实例轮廓，并最小化真实和合成数据之间特征空间的差异，在广泛实验的基础上，表明我们的网络相比单任务基线学习到更具有可转移性的表示，使得在 PASCAL VOC 2007 分类和 2012 检测上能够产生最先进的迁移学习结果。

Nov, 2017