- 控制色彩:多模态扩散交互式图像着色
引入了一种多模态的着色方法,通过利用预训练的稳定扩散模型,支持高度可控的交互式图像着色,解决了多种限制性问题,包括用户互动、局部着色、非自然色彩渲染、色彩变化不足和色彩溢出。
- 集成和迁移学习在一种端到端自动彩色图像检测模型中的应用
该论文提出了一种结合迁移学习和集成学习方法的新颖方法,以减少训练时间和资源需求,并提出了一个模型来对自然彩色图像和计算机彩色图像进行分类。该模型利用预训练的 VGG16 和 Resnet50 分支,以及 MobileNet v2 或 Eff - 亮度增强和着色:用于定制化低光图像增强的分离网络
提出了一种称为 BCNet 的 “明亮和着色” 网络,通过引入图像着色来解决低光条件下图像增强的问题,并实现基于用户偏好的不同饱和度和颜色风格的定制增强。
- DiffColor:使用扩散模型进行高保真度文本引导图像上色
利用预训练的扩散模型来恢复以提示文本为条件的鲜艳颜色而无需任何额外输入,具有高质量的图像重建、丰富多样的颜色、可在上下文中进行彩色显示以及对象级可控颜色化效果,超过先前的研究在视觉质量、颜色保真度和颜色化选项的多样性方面的表现。
- 通过切片 Wasserstein 广义测地线实现快速的最优输运
本文提出了一种新的 WD 代理 min-SWGG,该代理基于两个输入分布的一维最优投影诱导的运输映射,并提供了一个相关的传输计划,证明 min-SWGG 是 WD 的上界且具有类似于切片 Wasserstein 的复杂度和梯度下降优化。作者 - 使用文本描述进行图像的多模态着色
该研究提出了一种基于深度网络和文字描述的图像上色方法,通过对象分割和融合模型实现对包含不同颜色物体的真实场景的颜色一致性上色,性能指标优于现有的上色技术。
- 基于 Piggyback 模型的改进扩散图像上色
本文介绍了一个基于 T2I 模型的彩色转换模型,利用预训练的 T2I 模型的颜色先验知识,结合扩散引导器产生符合灰度图像视觉语义的潜在色调,接着使用一个灵敏度感知的 VQVAE 模型,生成与给定灰度输出像素完美对齐的彩色结果。在大量的实验中 - SPColor:基于语义先验指导的基于范例的图像着色
提出了 SPColor—— 一种基于语义先验引导的模板图像着色框架,它利用未经监督的分割模型提供的语义先验来显式排除不同语义类别之间的不良对应关系,并显著缓解了不匹配问题,在公共数据集上定量和定性地优于最新的现有方法。
- 使用稀疏表示生成图像
本文提出一种基于分块离散余弦变换(DCT)块的生成模型,使用 Transformer-based 自回归模型对块进行预测,以生成高质量、多样化的图像,并展示了对于简单的改进,该方法在图像着色和高精度图像放大方面也具有有效性。
- 图像着色:调查和数据集
这篇文章对基于深度学习的最新图像上色技术进行了全面调查,将现有的上色技术分类并讨论其性能等重要因素,主要分类包括七个类别,介绍了其基础块体系结构,输入,优化器,损失函数,训练协议和训练数据等方面,然后引入了一种新的颜色上色数据集并利用已有的 - CVPR实例感知图像上色
本论文提出了一种基于物体实例的彩色化方法,利用深度神经网络提取物体级别的特征,并采用融合模块组合全图像级别和物体级别的特征来预测最终颜色,大规模实验结果表明该方法优于现有的方法,达到了图像彩色化的最新性能。
- CVPR胶囊网络图像彩色化
本研究探讨了一种简单的 Capsule 网络 (CapsNet) 拓扑结构,用于图像着色问题。通过修改网络结构,将这个原本用于图像分类问题的 CapsNet 模型适用于 CIE Lab 颜色空间下灰度图像到彩色图像的生成和分割任务,利用 V - 像素化的语义着色
使用卷积神经网络、自回归模型以及像素化对象语义来引导图像上色,结果在 PASCAL VOC2012 和 COCO-stuff 上表现更好。
- 基于像素级语义的图像自动上色
该论文提出了使用像素级对象语义来引导图像上色,并使用具有两个分支的分层神经网络,以便学习对象及其颜色,以提高图像上色的真实感和质量,并引入联合双边上采样层以解决边缘颜色渗漏问题。
- 使用 CNN 从 SAR 图像生成高质量可见光图像
本文提出了一种基于生成对抗网络和级联卷积神经网络的新方法,用于从合成孔径雷达图像生成高质量的可见光图像,实验表明该方法在去斑和图像上色方面比目前的深度学习方法表现更好。
- CVPR基于循环注意模型的语言图像编辑
本文介绍了一种通过自然语言描述编辑图片的方法,使用基于递归注意力模型的通用框架,包括图像分割和图像着色两个子任务,并引入终止门来动态决定是否从文本描述中继续提取信息,该框架在 CoSaL、ReferIt 和 Oxford-102 Flowe - 基于学习的深度先验的实时用户引导图像着色
本研究提出了一种基于深度学习的图像上色系统,在输入灰度图像和用户指定信息的情况下,利用卷积神经网络将其映射至彩色图像,并对其进行上色。该系统利用大规模数据集对低级和高级语义信息进行学习,根据现有输入向用户推荐可能的颜色,通过单次前馈传递实现 - ECCV自动上色的学习表示
我们开发了一个完全自动化的图像上色系统,使用最新的深度网络技术,利用低级别和语义表示,通过预测每个像素的颜色直方图进行训练。无论是在完全自动化的还是部分自动化的上色任务中,我们的方法都优于现有方法。同时,我们也探索使用上色作为自监督视觉表示