多样化上色的结构一致性与可控性
使用变分自编码器 (VAE) 建立灰度图像到多种可能颜色映射的条件模型,利用多模态分布的采样得到表现出长程空间协调性的多样性上色结果。与条件卷积变分自编码器(CVAE)和条件生成对抗网络(cGAN)方法相比,多模态变量 (VAE) 方法能够获得更好的多样性上色效果。
Dec, 2016
本文介绍一种使用深度结构输出回归学习框架来解决计算机视觉中的颜色均衡问题的方法,该框架结合了深度卷积神经网络的优势,可以自动发现强特征用于白平衡,同时学习多项输出回归器以找到复杂目标变量间的相互依赖关系。实验表明,该方法在两个公共基准测试中取得了与最先进方法的竞争性表现。
Jul, 2016
引入了一种多模态的着色方法,通过利用预训练的稳定扩散模型,支持高度可控的交互式图像着色,解决了多种限制性问题,包括用户互动、局部着色、非自然色彩渲染、色彩变化不足和色彩溢出。
Feb, 2024
该研究提出了一种新的视频着色框架,它将语义对应引入自动视频着色中以保持长程一致性,通过自动着色参考图像来监督整个着色过程,并且引入了语义对应网络和图像着色网络以保持临近帧和长期帧的时间一致性,实验证明该方法在维持时序一致性方面优于其他方法。
May, 2023
本文提出了一种称为 GCP-Colorization 的自动上色方法,它利用先前预训练的生成对抗网络(GAN)中丰富且多样化的颜色先验知识,并利用 GAN 编码器 “检索” 匹配特征,然后通过引入特征调节到上色过程中,实现了单次前向传递产生生动颜色的效果,此外,该方法具有可解释性和可控性,并能够通过修改 GAN 潜在代码获得不同的结果。
Aug, 2021
这篇论文提出了使用梯度一致性信息来评估线性化的有效性,并将此信息用于确定作为解析梯度一致性模型的一部分应用于数据项的权重,以取代基于预定日程的数据库学术自调度,该模型通过分析得出的梯度一致性模型用于于目标视图的空间梯度和源视图的空间梯度之间不匹配的视图对的数据项。我们表明,梯度一致性模型在收敛速度和准确性方面优于标准的粗粒度到精细度方案和最近提出的逐步包含视图的方法。
May, 2024
本文提出了一种基于分类任务的自动化方法,使用卷积神经网络在测试时前向传递来处理图像的着色问题,并且提高了其结果的颜色多样性,相比之前的方法机器生成的着色更加逼真,并且证明了这种自动着色可以作为一项有效的预训练任务,提供了在特征学习领域上最好的性能。
Mar, 2016
本文提出了一种名为 DualVAE 的混合表示模型,通过学习颜色和几何特征的分离表示来控制彩色属性,这种模型可以通过转移来自示例图像的颜色潜在表征来重新着色现有图像,并且在各种数据集上表现出比 VQ-GAN 更好的 FID,包括动画面孔,标志和艺术景观。
May, 2023