- 揭示空间:从室内空间图像中获取具有建筑意义的语义描述
该研究论文旨在通过提出的模型从二维场景中提取具有建筑意义的语义描述,通过训练合成生成的图像以及相应的高级建筑结构,使用像素级比较评估,在真实环境中对其性能进行测试和评估。
- PhenDiff: 使用条件扩散模型揭示隐形表型
基于条件扩散模型的 PhenDiff 方法在显微镜图像中识别微小表型,优于 CycleGAN 在生成图像的质量和多样性方面,并展示了该方法在显示罕见神经发育障碍引起的隐形表型变化方面的应用。
- STEREOFOG -- 基于实际数据集的图像转换去雾
图像到图像转换是机器学习的一个子类型,具有在存在两个图片域之间需要转换的应用中具有巨大潜力,例如去除雾霾。本文介绍了 STEREOFOG 数据集,该数据集包含 $10,067$ 对模糊和清晰图片,通过自建设备进行拍摄,目的在于探索此领域中图 - Open-DDVM: 光流估计的扩展与复制
本技术报告介绍了第一个开源的 DDVM 模型的复现,通过研究一些设计选择,我们发现了一些重要的因素,并且通过在公共数据上进行训练,在性能上与闭源的 DDVM 相当。
- S2ST:基于隐变分扩散种子空间的图像到图象翻译
S2ST 是一个新颖的框架,用于在复杂的照片逼真图像中实现全局图像转换,如汽车场景的日夜或晴雨转换,通过利用由潜在扩散模型学习到的强大图像先验,S2ST 在改善保真度的同时保持了目标领域的外观,并超越了基于 GAN 的图像转换方法和基于扩散 - 走向无监督表示学习:学习、评估和传递视觉表示
无监督表示学习、卷积自组织神经网络、评估协议、表示传输、图像到图像转换
- 精细的外观转换模型
提出了一个创新性框架,通过集成语义匹配、外观转换和潜在偏差的各个方面,来达到细粒度细节的精确和自然转换,其中关键的要素是扩散模型在扩散过程的潜在空间内对预测的 x0 范围的战略使用,用于实现源图像和目标图像的语义对齐,便于改善特征获取的逐掩 - 多轴融合增强 MR 图像转换中的不确定性估计
我们提出了一种新的模型不确定性量化方法 MAF,该方法依赖于从体积图像数据的多个视图中获得的互补信息的集成,应用于 3D 医学图像到图像转换的认知不确定性估计,并在合成对比增强的 T1 加权影像上应用。
- CycleGANAS:CycleGAN 的可微分神经架构搜索
我们为 CycleGAN 开发了一种神经架构搜索(NAS)框架,用于执行无成对图像到图像的翻译任务,并设计了由简单的基于 ResNet 的单元堆栈组成的架构,有效探索大搜索空间,并且成功解决了数据不平衡的问题。这是 CycleGAN 的第一 - 自适应潜在扩散模型用于三维医学图像到图像翻译:多模态磁共振成像研究
提出了基于潜在扩散模型的多模态图像转换模型,通过使用切换块进行图像到图像转换,解决了临床实践中获取多种模态图像的难题,实现了高质量的目标模态生成。
- 深度学习实现亚距离限制扫描超透镜显微镜的大景深图像
使用深度学习构建的扫描超透镜显微镜 (SSUM) 系统通过光学超分辨率图像和扫描电子显微镜 (SEM) 领域图像之间的映射关系,将光学超分辨率图像转化为类似 SEM 的具有大景深的图像,其在图像转换中表现出色,重构结果具有高层次的细节,适用 - CycleNet:对图像操控中基于文本引导扩散的循环一致性的重新思考
Cyclenet 是一种新颖而简单的方法,将循环一致性引入扩散模型 (DMs) 以规范图像处理,通过引入循环一致性提高了翻译一致性和质量,并能使用简单的文本提示生成高质量的超领域分布图像。
- 关于无监督图像到图像的转换和 GAN 稳定性
该研究论文探讨图片到图片翻译的问题,以及如何在计算机视觉应用中如上色、修补和分割等方面应用无监督学习和生成对抗网络,并提出两种模型以解决 GAN 稳定性问题,并得出与文献讨论一致的问题假设。
- 图像对图像的深度强化学习翻译
通过深度强化学习将图像到图像翻译问题重新定义为逐步决策问题,提出了一种新的基于强化学习的框架,该框架将学习过程分解成小步骤,使用轻量级模型逐步转换源图像到目标图像,并引入次级策略和计划的概念来解决高维连续状态和动作空间的问题,在此框架中采用 - UGC: 统一生成对抗网络压缩用于高效图像转换
近年来,生成对抗网络在图像到图像翻译中取得了显著进展,然而,这些 GAN 模型的成功依赖于繁重的计算成本和劳动密集型的训练数据。为了兼顾模型效率和标签效率的优点,我们提出了一种新的学习范式,统一生成对抗网络压缩,通过在网络架构搜索和自适应在 - 基于核心感知的自监督预训练:使用图像对图像转换技术的非配对组织病理学图像
提出一种新颖的基于细胞核感知的自监督预训练框架,通过组织病理图像与伪掩膜图像之间的无配对图像转换来捕获细胞核形态和分布信息,并采用条件和随机样式表示来调节生成过程,以实现预训练图像的真实性和多样性;同时,采用实例分割引导策略来捕获实例级信息 - 多任务购物网站图片缺陷修复的层次条件半配对图像转换
本研究提出了一种统一的图像到图像翻译 (I2I) 模型,以纠正商品网站上不同产品类型的多个缺陷,该模型利用注意机制层次化地结合高层次的缺陷组和特定的缺陷类型,指导网络关注与缺陷相关的图像区域,并在实际购物网站数据集上进行测试,相较于 WS- - 探索非配对图像翻译中的语义一致性,以生成外科应用数据
探索了无配对图像翻译技术在手术应用中生成具有语义一致性数据的可行性,并发现结构相似性损失和对比学习的简单组合方法取得了最有希望的结果。定量分析表明,使用这种方法生成的数据具有更高的语义一致性,可以更有效地用作训练数据。
- StereoFlowGAN: 无监督领域适应下的立体与光流联合训练
我们介绍了一种新的训练策略,用于立体匹配和光流估计,该策略利用合成和真实图像域之间的图像翻译。我们的方法使得训练模型在真实图像情景中表现出色,同时仅依赖于合成图像的真实信息。为了促进任务无关的域适应和任务特定组件的训练,我们引入了一个处理左 - DiffI2I:高效的图像 - 图像转换扩散模型
提出了一种名为 DiffI2I 的简单、高效和强大的 I2I 扩散模型,通过引入紧凑的 I2I 先验提取网络(CPEN),动态 I2I 转换器(DI2Iformer)和去噪网络来解决了传统 DM 在某些 I2I 任务中的效率和生成能力方面的