- ICCVScenimefy: 学习通过半监督的图像到图像翻译技术创作动画场景
提出了一种新的半监督图像转换框架 Scenimefy,利用结构一致的伪对齐数据,以简化纯无监督的设置,通过分割引导数据选择来获得高质量的伪监督,并引入补丁对比风格损失来提高风格化和细节,实验证明了该方法在感知质量和定量性能方面优于现有技术基 - 基于去噪扩散的 MR 到 CT 图像转换使 2D 和 3D 全脊椎椎骨分割无需手动标注
通过自动分割脊柱 MR 图像,实现基于图像注册的配对数据翻译,并提供解剖正确的分割结果。
- 侏罗纪世界重制:通过零样本长图像转换将古代化石复活
利用文本引导的潜在扩散模型,在大领域差距中实现了零样本图像到图像的翻译,并提出了新的任务 Skull2Animal 以在头骨与活体动物之间进行翻译,通过指导式扩散和图像编辑模型设计了 Revive-2I 基准模型,桥接大领域差距需要先有目标 - 高保真图像到图像转换的层次流
提出了一种新流模型(Hierarchy Flow)用于图像到图像的翻译,通过层次化耦合、多尺度建模和对齐式损失实现更好的内容保留和风格转换,在图像到图像翻译任务中达到了最先进的性能。
- 基于图像的逼真且保持身份无损的情绪操控与潜在扩散模型
探究通过 “野外” 图像进行情绪操作的扩散模型的能力并进行广泛的定量和定性评估,该方法在图像质量和真实性方面表现卓越,与基于 GAN 的对应方法相比,在情绪转换方面取得了有竞争力的结果。
- SDDM:用于非配对图像到图像转换的基于得分分解的流形扩散模型
通过每个时间步骤在图像生成过程中优化纠缠的分布,以及通过降低维度但仍保持扰动参考图像高度集中的构建流形的块自适应实例归一化模块,新的基于分数分解扩散模型 (SDDM) 在多个 I2I 基准测试中表现优于现有的基于分数的扩散模型 (SBDM) - ICCV利用单张图像指导的通用图像到图像转换
提出了一种名为视觉概念转换器 (VCT) 的新型框架,通过借鉴单个参考图像来保留源图像的内容并翻译视觉概念,已证明此方法在广泛的图像转换任务中具有出色的结果。
- 流向引导的可控线描生成
本文提出了一种基于人工智能和艺术的 Vector Flow Aware 和 Line Controllable 的图像到图像翻译架构,通过所设计的 Double Flow Generator 架构和 Line Control Matrix - 增强空间上下文的潜在图注意力
本文介绍了一种计算效率高且模块化的框架 ——Latent Graph Attention(LGA),该框架能够将全局背景信息融入现有架构中,特别是能够使小型架构的性能接近大型架构,从而使轻量级架构在计算能力和能源需求较低的边缘设备中更加有效 - 单图低动态范围(LDR)到高动态范围(HDR)转换的条件扩散
该研究论文提出了一种基于深度学习的方法,用于从阴影和高光中恢复复杂细节以及重建高动态范围图像,通过图像到图像转换任务,提出了一种基于条件性去噪扩散概率模型(DDPM)的框架,并在该框架中结合了深度卷积神经网络(CNN)的自编码器来提高用于条 - 滤波引导扩散:针对黑盒扩散模型的快速滤波引导
本研究通过在每个扩散步骤的输入上应用自适应滤波器(不需要任何额外的培训或网络内部特征),提供与最新的基于体系结构依赖方法相竞争的快速和强大的基线,并允许更连续地调整指导强度。除此之外,还可以用作简单的附加组件,以增强其他最先进的 I2I 方 - 通过潜空间定位的领域可扩展非配对图像翻译
提出了一种新颖的图像生成方法:latent space anchoring,可以实现在不需要调整现有域的编解码器的情况下扩展到新的视觉域,该方法通过学习轻量级编码器和回归器来将不同域的图像锚定到相同的冻结 GANs 的潜在空间中,并且其编码 - 面向多领域图像转换的增量能量协作学习
本文研究了一种新型一种基于能量的协作学习框架,用于多领域图像到图像的转换。该框架由描述符、翻译器、样式编码器和样式生成器四个组成部分组成,能够实现一个到多个的转换。该框架通过多领域 MCMC 教学共同训练多领域的描述符和多样化的图像生成器。
- 一种半匹配的标签到图像翻译方法
本文提出了第一个半监督(半配对)的框架,用于标签到图像的翻译,使用输入重构任务并利用条件鉴别器来作为反向生成器,证明了所提出模型在标准基准测试中优于现有的无监督和半监督方法,同时使用更少的配对样本。
- 语义感知 Mask CycleGAN:将艺术人像转化为照片般逼真的可视化呈现
本文提出了 Semantic-aware Mask CycleGAN(SMCycleGAN)架构,可以将艺术画像翻译成照片现实视觉效果,该模型可以生成逼真的人类肖像,并通过向鉴别器馈送语义掩码的伪样本来强制其做出有用决策,以便对发电机进行优 - 神经薛定谔桥通过非成对图像翻译
本研究介绍了一种新的无配对数据图像翻译方法 ——Unpaired Neural Schrödinger Bridge (UNSB), 它结合了 Schrödinger Bridge 模型和对抗训练等方法来进行学习,有效解决了高分辨率图像翻译 - 基于变分贝叶斯框架的领域相关变量高级图像生成
通过定义一个统一的贝叶斯框架,我们提出了一种变分贝叶斯图像转换网络(VBITN),该网络可以实现多个图像转换和编辑任务;在诸多实验中我们显示了该方法在无监督图像到图像翻译中的有效性,并证明了其在语义编辑和混合领域翻译方面的新颖高级能力。
- 低分辨率指导下的领域无关图像翻译
本论文提出了一种面向细粒度问题的无域图像转换方法,其使用一种全新的方法生成图像,这种方法集中在从源图像提取视觉特征并与低频信息相结合,以生成符合期望的输出图像,该方法在处理面向细粒度问题的图像转换任务时能够生成更真实的图像样本。
- 无监督领域转移在科学上的应用:探索深度学习方法在不同响应模型的液体氩时投影室探测器模拟之间的翻译中的应用
本研究基于图像转换技术提出了一种自动的无监督方法,用于减少模拟数据与实验数据之间的系统性差异,其中将 TOY 模型应用于两组 LArTPC 探测器事件样本,验证了该方法的有效性,并对其生成的数据集 SLATS 进行开源共享,提供给研究人员开 - 无监督图像翻译的多作物对比学习
本文提出了一种新颖的基于对比学习的无配对图像翻译框架 MCCUT,通过多视图裁剪生成多样化的负样本,利用领域一致性误差函数将深度特征空间中的嵌入约束在一起,并采用 DCSE 模块来设计生成器以获得更好的结果。