多样化上色的结构一致性与可控性

ECCVSep, 2018

多样化上色的结构一致性与可控性

Structural Consistency and Controllability for Diverse Colorization

Safa Messaoud, David Forsyth, Alexander G. Schwing

TL;DR该研究开发了一种基于条件随机场的变分自编码器公式，能够在考虑结构一致性的同时实现多样性，并引入可控机制来融合来自各种来源的外部约束，从而在 LFW、LSUN-Church 和 ILSVRC-2015 数据集上获得更多多样化和全局一致性的着色。

Abstract

Colorizing a given gray-level image is an important task in the media and advertising industry. Due to the ambiguity inherent to colorization (many shades are often plausible), recent approaches started to explicitly model →

colorization conditional random field variational auto-encoder structural consistency diversity

发现论文，激发创造

学习多样化的图像上色

使用变分自编码器 (VAE) 建立灰度图像到多种可能颜色映射的条件模型，利用多模态分布的采样得到表现出长程空间协调性的多样性上色结果。与条件卷积变分自编码器（CVAE）和条件生成对抗网络（cGAN）方法相比，多模态变量 (VAE) 方法能够获得更好的多样性上色效果。

Dec, 2016

通过生成对抗网络实现无监督多样化着色

本文介绍了一种使用条件生成式对抗网络解决无监督多样化上色问题的方法，并在 LSUN 卧室数据集上表现出高竞争性和高可信度的着色结果。

Feb, 2017

深度结构输出回归学习在计算颜色恒定性中的应用

本文介绍一种使用深度结构输出回归学习框架来解决计算机视觉中的颜色均衡问题的方法，该框架结合了深度卷积神经网络的优势，可以自动发现强特征用于白平衡，同时学习多项输出回归器以找到复杂目标变量间的相互依赖关系。实验表明，该方法在两个公共基准测试中取得了与最先进方法的竞争性表现。

Jul, 2016

概率图像着色

该研究提出了一种基于概率的技术，用于为灰度自然图像着色，具有多个可能的着色方案和适当的随机采样方案，并通过严格的理论框架支持训练过程，达到了强大的实验结果。

May, 2017

控制色彩：多模态扩散交互式图像着色

引入了一种多模态的着色方法，通过利用预训练的稳定扩散模型，支持高度可控的交互式图像着色，解决了多种限制性问题，包括用户互动、局部着色、非自然色彩渲染、色彩变化不足和色彩溢出。

Feb, 2024

基于语义对应的时序一致自动视频上色

该研究提出了一种新的视频着色框架，它将语义对应引入自动视频着色中以保持长程一致性，通过自动着色参考图像来监督整个着色过程，并且引入了语义对应网络和图像着色网络以保持临近帧和长期帧的时间一致性，实验证明该方法在维持时序一致性方面优于其他方法。

May, 2023

应用生成式色彩先验实现鲜艳多样的图像上色

本文提出了一种称为 GCP-Colorization 的自动上色方法，它利用先前预训练的生成对抗网络（GAN）中丰富且多样化的颜色先验知识，并利用 GAN 编码器 “检索” 匹配特征，然后通过引入特征调节到上色过程中，实现了单次前向传递产生生动颜色的效果，此外，该方法具有可解释性和可控性，并能够通过修改 GAN 潜在代码获得不同的结果。

Aug, 2021

利用新颖的梯度一致性模型进行多视角视差估计

这篇论文提出了使用梯度一致性信息来评估线性化的有效性，并将此信息用于确定作为解析梯度一致性模型的一部分应用于数据项的权重，以取代基于预定日程的数据库学术自调度，该模型通过分析得出的梯度一致性模型用于于目标视图的空间梯度和源视图的空间梯度之间不匹配的视图对的数据项。我们表明，梯度一致性模型在收敛速度和准确性方面优于标准的粗粒度到精细度方案和最近提出的逐步包含视图的方法。

May, 2024

彩色图像上色

本文提出了一种基于分类任务的自动化方法，使用卷积神经网络在测试时前向传递来处理图像的着色问题，并且提高了其结果的颜色多样性，相比之前的方法机器生成的着色更加逼真，并且证明了这种自动着色可以作为一项有效的预训练任务，提供了在特征学习领域上最好的性能。

Mar, 2016

DualVAE：控制生成和真实图像的颜色

本文提出了一种名为 DualVAE 的混合表示模型，通过学习颜色和几何特征的分离表示来控制彩色属性，这种模型可以通过转移来自示例图像的颜色潜在表征来重新着色现有图像，并且在各种数据集上表现出比 VQ-GAN 更好的 FID，包括动画面孔，标志和艺术景观。

May, 2023