- LM4LV:一个用于低级图像任务的冻结大型语言模型
该研究论文提出了一种名为 LM4LV 的框架,它能够使冻结的大型语言模型 (LLM) 解决一系列的低层次视觉任务,展示了 LLM 在低层次视觉中的强大潜力,并且架起了 MLLM 和低层次视觉任务之间的桥梁。
- DRCT:拯救图像超分辨率技术摆脱信息瓶颈
通过在层间添加密集残差连接以减少空间信息的丢失,我们提出了 Dense-residual-connected Transformer (DRCT) 模型,提高了视觉变换和超分辨率任务的性能。
- Q-Boost: 低层多模态基础模型的视觉质量评估能力研究
通过引入中性提示和多提示集成两个关键的组成部分,Q-Boost 方法在图像质量评估和视频质量评估任务中增强了低级多模态大语言模型在低级视觉问题方面的能力,并展示了优秀的零样本性能。
- 控制视觉 - 语言模型用于通用图像修复
我们提出了一种降级感知的视觉 - 语言模型(DA-CLIP),用于将预训练的视觉 - 语言模型应用于低级视觉任务,作为通用的图像恢复框架,通过集成嵌入到图像恢复网络中并进行交叉注意力,使模型能够学习高保真度的图像重建。
- CVPR结合半监督和正未标记学习提升全参考图像质量评估
本文提出了一种利用半监督和正无标记学习方法来提高无标签数据质量检测表现的方法,通过动态生成伪 MOS,结合全参考图像质量评估和空间注意力机制来处理 GAN 模型带来的误配问题。在多项数据集实验中表现良好。
- 基于物理学的生成对抗模型用于图像修复及其它领域
该研究提出了一种基于生成模型和对抗学习的图像恢复算法,并通过物理模型约束学习提高了生成对抗网络的图像生成质量,具有在多种低级视觉问题中应用的广泛适用性。
- CVPR竞争性合作:深度、相机运动、光流和运动分割的联合无监督学习
本篇论文提出了一种基于 Competitive Collaboration 框架的无监督学习方法,通过协同训练多个神经网络来解决低级视觉问题,包括单个视图深度预测、相机运动估计、光流和视频分割,可以同时推理场景的运动物体、物体深度和背景的光 - CVPR学习双卷积神经网络用于低层次视觉
本文提出了一种通用的 DualCNN 卷积神经网络,用于解决低级别视觉问题,如超分辨率、边缘保留滤波、降雨和去雾。DualCNN 由两个并行的分支组成,分别恢复结构和细节,是低级别视觉任务的一种灵活的框架,可以轻松地集成到现有的 CNN 中 - CVPR学习深度 CNN 去噪先验用于图像恢复
本篇论文旨在通过变量分裂技术将快速鉴别式去噪模块插入基于模型的优化,实现解决逆问题的目的,并着重于训练一组快速有效的卷积神经网络去噪器以及将其融合到模型优化中,以便更好地应对各种相关低级视觉应用,实验结果表明,学习到的去噪器不仅在高斯去噪方 - 图像处理的卷积神经金字塔
本研究提出了一种基于卷积神经金字塔(CNP)框架的、旨在解决低层次视觉和图像处理任务的方法,可实现低计算复杂度下大感受野视觉处理。此方法适用于图像复原、填补、降噪、去除伪影、边缘升华、滤波、增强和上色等应用领域。
- MM基于轻量级残差卷积神经网络的单张图像超分辨率
本研究旨在扩展残差网络的优点,如快速训练,用于低级视觉问题,即单个图像超分辨率,通过引入跳跃连接和逐渐改变网络形状的策略,该方法在单个图像超分辨率上取得了最新的 PSNR 和 SSIM 结果,并产生了视觉上令人愉悦的结果。
- ICCV深度卷积网络用于压缩伪影降噪
通过深度卷积网络的成功在超分辨率方面的成功,该论文提出了一种紧凑有效的网络,用于无缝衰减不同类型的压缩伪影,并证明使用传输学习和易于困难学习的思想可以在低级别视觉问题中实现出色的性能。
- 深度卷积网络降低压缩伪影
该研究提出了一种基于深度卷积网络的紧凑高效方法来无缝地衰减不同压缩引起的复杂压缩伪影,同时展示了在多个现实场景下该方法的优越表现和适用性。
- CVPR基于区域空间层次结构的共识低层视觉
介绍了一个多尺度框架来实现低级视觉任务,使用图像的密集、重叠的多个尺度进行估计,表明该框架在双目视觉任务上表现良好,并生成适合结合高级推理和其他低级线索的分布式场景表达式。
- 图像复原中基于滤波器的 MRF 的损失特定训练的再探讨
本文探讨了学习 Markov 随机场中参数的两种方法:基于采样的概率学习和基于 MAP 估计的损失特定训练,并提出了一种新的基于双层优化的算法,在较高的精度下解决了双层问题的下层问题,与基于概率训练的 MRF 模型相比,表现更加出色。