Apr, 2024

在野外应用具有控制能力的视觉语言模型进行照片逼真图像修复

TL;DR采用强大的视觉语言模型和合成降解管道,通过基于扩散模型和后验采样策略的鲁棒训练,提高图片还原质量并解决特定数据集无法恢复模糊、缩放、噪声和JPEG压缩等不同降解方式的问题。