Oct, 2024

基于文本到图像扩散模型的无监督模态适应用于语义分割

TL;DR本研究解决了现有无监督领域适应方法在语义分割中,仅关注图像域适应而未利用其他丰富视觉模态(如深度、红外和事件)的问题。我们提出了一种新的模态适应方法MADM,利用预训练的文本到图像扩散模型生成更准确的伪标签,从而提升模型的跨模态能力。实验结果表明,MADM在图像到深度、红外和事件模态等多个任务上取得了最先进的适应性能。