Mar, 2024

视觉语言合成数据增强心脏超声下游任务

TL;DR利用最近的视觉 - 语言模型,通过文本和语义标签图引导,产生多样和逼真的合成心脏超声图像数据,以保留原始图像的关键特征。研究了无条件生成、文本引导生成和混合方法,并展示出合成数据中存在的丰富上下文信息可能提高下游任务的准确性和可解释性,例如改善指标和更快收敛的心脏超声图像分割和分类。实现部分含有检查点、提示和创建的合成数据集可公开获取。