Oct, 2023

控制视觉 - 语言模型用于通用图像修复

TL;DR我们提出了一种降级感知的视觉 - 语言模型(DA-CLIP),用于将预训练的视觉 - 语言模型应用于低级视觉任务,作为通用的图像恢复框架,通过集成嵌入到图像恢复网络中并进行交叉注意力,使模型能够学习高保真度的图像重建。