Jan, 2024

LLMRA: 多模态大型语言模型恢复助手

TL;DR我们提出了一种基于多模态大语言模型(MLLM)的图像修复框架,名为多模态大语言模型修复助理(LLMRA),通过利用 MLLM 的印象能力来获取通用图像修复的降级信息,并通过 Context Enhance 模块和 Degradation Context based Transformer Network 将这些上下文嵌入整合到修复网络中,提供了输入低质量图像和恢复后高质量图像的低级属性描述。大量实验证明了 LLMRA 在通用图像修复任务中的卓越性能。