Sep, 2023

PathLDM:用于组织病理学的文本条件潜变扩散模型

TL;DR本研究介绍了 PathLDM,这是一种专为生成高质量组织病理学图像而设计的首个文本条件潜在扩散模型。通过利用病理学文本报告所提供的丰富语境信息,结合图像和文本数据,通过 GPT 的能力进行复杂文本报告的提炼和总结,我们实现了在 TCGA-BRCA 数据集上文本到图像生成方面的 SoTA FID 得分为 7.64,显著优于最接近的文本条件竞争对手的 30.1 的 FID 得分。