- MR 图像到图像翻译的相似度度量指标
图像到图像的转换在医学影像领域具有巨大影响,本研究介绍了用于图像合成评估的参考和非参考度量标准,并调查了九种需要参考的度量标准(SSIM、MS-SSIM、PSNR、MSE、NMSE、MAE、LPIPS、NMI 和 PCC)以及三种非参考度量 - 地图新现实:Pix2Pix 图像到图像翻译中的地面真实图像创作
该研究论文探讨了将 Pix2Pix 框架应用于抽象地图图像转换为逼真地面实际图像的一种新方法,解决了这些图像在城市规划和自主驾驶训练等领域关键缺失的问题。研究详细介绍了 Pix2Pix 模型的应用,通过一组配对的地图和航拍图像数据集进行高保 - 基于去噪扩散模型的光学图像转换:以异构变化检测为例
介绍一种创新的基于深度学习的方法,使用去噪扩散模型将不同光学传感器的低分辨率图像转换为高分辨率图像,保留内容并避免不需要的伪影,通过大规模多样的 Sentinel-II 和 Planet Dove 图像配对数据集进行训练和测试,解决了在多传 - WB LUTs:对比学习用于白平衡查找表
本文提出了一种基于 3D 查找表(LUT)的白平衡校正模型 WB LUTs,它能在实时环境中生成高分辨率输出,并引入了对比学习框架和新颖的困难样本挖掘策略,提高了基线 3D LUTs 的白平衡校正质量 25.5%。实验结果表明,所提出的 W - CVPRSyntStereo2Real:边缘感知生成对抗网络用于维持立体约束的遥感图像转换
远程感知领域中,缺乏立体匹配以及准确地面真实数据制约了深度神经网络的训练;合成图像作为替代方案缓解了此问题,但面临域泛化问题;结合图像到图像翻译和立体匹配的能力提供了有效解决方案;通过将图像到图像翻译网络和立体匹配网络联合优化,我们提出一种 - MoMA: 快速个性化图像生成的多模式 LLM 适配器
本篇论文介绍了 MoMA:一种基于开放词汇、无需训练的个性化图像模型,具备灵活的零样本能力。利用开源的多模态大型语言模型(MLLM),我们训练 MoMA 同时担任特征提取器和生成器的双重角色。该模型通过引入一种新颖的自注意力快捷方法,高效地 - 光学相干断层扫描图像的对比非配对图像转换的解剖条件
通过图像到图像(I2I)转换对不同模态的医学图像进行统一分析,解决因信息差异导致的非成对映射挑战。为了恢复语义一致性,本研究在对比学习非成对 I2I 转换(CUT)方法的基础上,通过额外的分割解码器支持风格解码器,提高样式转换图像与目标分布 - 医学图像翻译的串联多路径快捷扩散模型
提出了一种级联多路径快捷扩散模型(CMDM),用于高质量医学图像翻译和不确定性估计,能够产生与最先进方法相媲美的高质量翻译,并提供与翻译误差相关的合理不确定性估计。
- RoNet:基于旋转的连续图像转换
本文介绍了一种基于旋转的解决方案,通过对图像的样式表示进行平面旋转来实现连续生成,从而实现了一种名为 RoNet 的网络。我们在生成网络中嵌入了旋转模块,通过自动学习适当的平面,同时解开图像的内容和样式。为了鼓励真实纹理,我们还设计了一种基 - StegoGAN: 利用隐写术进行非双射图像到图像的翻译
在非双射图像翻译的挑战下,我们引入了 StegoGAN,一种利用隐写术防止生成图像中虚假特征的新模型。我们的实验评估表明,StegoGAN 在各种非双射图像翻译任务中优于现有的基于 GAN 的模型,无论是从质量上还是从数量上来讲。
- 基于灰度重新定义的高分辨率图像转换模型
提出了一种创新的图像翻译方法,包括利用灰度调整方法进行像素级翻译、利用 Pix2PixHD 模型以及改进的损失函数来增强图像翻译性能,解决了稀疏训练数据的问题。
- StainDiffuser: 虚拟染色的多任务双扩散模型
StainDiffuser 是一种新颖的多任务双扩散架构,用于通过有限的训练预算实现虚拟染色,能同时训练细胞特异性的免疫组织化学染色和基于 HE 的细胞分割。
- FSL 模型得分更高
通过图像转换生成样本,并在生成的样本上进行分类,可以提高 few-shot-learning 模型在测试阶段的性能。
- 改进多对一图像到图像转换的深度生成模型
通过引入 Colorized MNIST 数据集和 Color-Recall 评分,提出一种新的非对称框架以改进现有的深度生成模型在多对一图像翻译任务中的性能,应用于 StarGAN V2,并在无监督和半监督设置下表现出更好的结果。
- 利用扩散模型改进 2D-3D 稠密对应关系以提高 6D 物体姿态估计
比较了基于 GAN 和扩散模型的图像翻译网络在 6D 物体姿态估计任务中的表现,结果表明扩散模型优于 GAN,揭示了进一步改进物体姿态估计模型的潜力。
- 用于从噪声数据转化医学图像的环境 - Pix2PixGAN
通过噪声测量数据,提出了一种新的医学图像到图像翻译任务的条件生成对抗网络架构 ——Ambient-Pix2PixGAN,通过传统图像质量度量和任务性能度量验证了该方法能够在噪声测量数据上成功训练,并产生高质量的目标成像模态翻译图像。
- Re:Draw-- 上下文感知翻译作为艺术创作的可控方法
介绍了一种上下文感知翻译方法,将修补和图像转换的优点相结合,同时尊重原始输入和上下文相关性,为艺术创作中 AI 的可控使用开辟了新途径。作为一个应用案例,我们将该方法应用于根据任何设计规范重绘任何手绘动画角色的眼睛 - 眼睛作为吸引观众注意 - 镜面扩散:通过提示重述和更多方法稳定零样本图像翻译过程
最近,文字到图像扩散模型成为图像处理领域的一种新范式,包括内容生成、图像恢复和图像到图像的转换。本文提出了一种 Prompt 重新描述策略,以实现扩散模型中源图像和重构图像的镜像效应,从而实现准确的零样本图像翻译。
- MRI 图像翻译的 CycleGAN 模型
该研究提出了使用 CycleGAN 模型将神经图像从一种场强转化为另一种的方法,并将其与基于 DCGAN 结构的模型进行了比较,结果表明 CycleGAN 能够以较高的准确度生成合成和重构图像。
- 高保真基于扩散的图像编辑
扩散模型在图像生成和编辑领域取得了显著的成功。我们提出了一种创新的框架,其中包含一个修正模块,用残差特征调节扩散模型权重,以填补编辑过程中准确性的差距。此外,我们引入了一种新的学习范式,旨在在编辑过程中最小化错误传播。通过大量实验证明,我们