Mar, 2024

XPSR:基于扩散的跨模态图像超分辨率的先验

TL;DR基于扩散的方法在图像超分辨率 (ISR) 中拥有强大的生成先验,在最近受到越来越多的关注。然而,由于低分辨率 (LR) 图像经常遭受严重降质,ISR 模型难以感知语义和降质信息,导致恢复图像出现错误的内容或不切实际的伪影。为了解决这些问题,我们提出了一个基于跨模态先验的超分辨率 (XPSR) 框架。在 XPSR 中,我们利用了前沿的多模态大语言模型 (MLLMs) 来获取扩散模型的精确和全面的语义条件。为了更好地融合跨模态先验,我们引入了一个语义融合注意机制。为了提取保留语义信息而不是不需要的降质,我们在 LR 图像与其高分辨率 (HR) 对应物之间添加了无降质约束。定量和定性结果表明,XPSR 能够在合成和真实世界数据集上生成高保真度和高真实性的图像。代码将在 https://github.com/qyp2000/XPSR 上发布。