- 扩散模型中与模型无关的人类偏好反转
提出一种新的采样设计方法,通过优化噪音分布以满足人类偏好,而不需要微调扩散模型,从而实现高质量的一步图像生成;实验证明,定制的噪音分布显著提高图像质量,并在计算成本仅略微增加的情况下取得了重要的突破,同时凸显了噪音优化的重要性,为高效和高质 - CVPR走向无需记忆的扩散模型
通过使用针对重复图像和标题、高度特定用户提示的三种指导策略的新颖框架 Anti-Memorization Guidance(AMG),我们成功实现了在生成高质量图像和文本对齐的同时,消除了训练数据的记忆化问题。AMG 还具备创新的自动检测系 - 潜水印:在潜在扩散空间中注入和检测水印
本文提出了一种在潜在空间中注入和检测水印的解决方案 —— 潜在水印(LW),并采用渐进训练策略。通过实验证明,在注入 64 位消息时,LW 在 9 个单次攻击场景和一个全攻击场景下,可以实现接近 100% 的识别性能和 97% 以上的归属性 - VersaT2I:利用多功能奖励改进文本到图像模型
最近的文本到图像 (T2I) 模型在大规模和高质量数据的帮助下,展现出令人印象深刻的性能,然而,这些 T2I 模型在生成具有美感、几何精确、忠实于文本和具有良好低级质量的图像方面仍然存在困难。我们提出了 VersaT2I,这是一个多功能的训 - 基于扩散概率模型的伪 MRI 引导 PET 图像重建方法
该研究使用扩散概率模型 (DPM) 从 FDG-PET 脑部图像中推断出 T1 加权 MRI,进而利用 DPM 生成的 T1w-MRI 指导 PET 重建,表明 MRI 引导的 PET 图像在改善图像质量方面优于 OSEM。
- CVPR基于扩散模型的选择性沙漏映射通用图像修复
提出了一种基于扩散模型的高级选择性沙漏映射策略 DiffUIR,通过强约束引导模型获得精确的扩散模型生成方向,将不同分布逐渐映射到一个共享分布中,结合共享分布项和强约束引导,DiffUIR 迭代地将共享分布引导到具有高图像质量的特定任务分布 - 用于面部合成攻击的分层生成网络
通过使用全局信息和局部详细信息的层次生成网络,结合面部区域外的伪影去除模块,我们提出了一种改进图像质量和保持身份的新型变形攻击方法,相对于现有攻击方法具有更高的模拟人眼能力和足够欺骗面部识别系统的威胁性。
- 放宽三维高斯平铺的准确初始化约束
通过分析频域中的结构化运动初始化和多个一维高斯回归任务的分析,我们提出了一种名为 RAIN-GS(放松 3D 高斯点云精确初始化约束)的新优化策略,成功地从随机点云训练 3D 高斯效果,并通过多个数据集进行定量和定性比较,大幅提高了在所有设 - 基于扩散的迭代反事实解释方法用于胎儿超声图像质量评估
使用基于扩散的对照解释人工智能技术,从低质量的非标准图像生成逼真的高质量的标准图像,改善产科超声图像质量,进而提供可靠的临床诊断和监测手段。
- 高加速心脏 Cine MRI 的临床可行扩散重建
我们旨在开发一种临床可行的基于扩散模型的重建流水线,以改善心脏磁共振成像的图像质量。通过使用多输入多输出的扩散增强模型和快速推理策略,扩散重建减少了临床数据中前瞻性欠采样引起的空间和时间模糊,并得到专家检查的验证。每个视频处理仅需 1.5 - 优化负面提示以提升文本到图像生成中的美观和真实度
通过使用负向提示,优化负向提示生成方法,可以显著提高图像生成质量。与其他方法相比,该方法在万能评分上提高了 25%,超过了测试集中的参考负向提示。此外,我们可以根据需求有针对性地优化最重要的指标,并构建了一个负向提示数据集。
- QUASAR:高品质和美观度评分的先进表征
该研究介绍了一种新的数据驱动的、非参数化的图像质量和美学评估方法,通过提出高效的图像锚点消除了对表达性文本嵌入的需求,在七个现有自监督模型的广泛评估中,我们的方法表现出卓越的性能和鲁棒性,不受数据和预处理流水线的天性的影响,在有限的数据下能 - PolyOculus:多视角基于图像的新视图综合
基于已知视图的创新视图综合的问题,我们提出了一种基于集合的生成模型,可以同时生成多个自洽的新视图,不仅限于生成单个图像,而且可以根据零个、一个或多个视图进行条件生成,可在大量视图生成中保持图像质量,并在像循环和双目轨迹等任务上显著优于其他方 - 波前随机化改善去卷积
通过添加随机掩蔽物到成像系统,减少对畸变的依赖,降低传递函数的零点概率,进而在去卷积过程中降低对噪声的敏感度,以提高图像质量。
- HiCD: 基于分层相关蒸馏的质量变化图像变化检测
应对图像品质差异带来的挑战,我们引入了一种基于知识蒸馏的创新训练策略,以高质量图像对获取的任务知识指导处理品质不同的图像对的学习过程。此外,我们开发了一种层次相关性蒸馏方法,通过复制教师模型中固有的相关性,而不仅仅关注个体特征,来确保有效地 - 将度量函数引入扩散模型
我们引入了一种级联扩散模型(Cas-DM),通过在训练中有效地结合额外的度量函数来改进去噪扩散概率模型(DDPM)。实验结果表明,该扩散模型的骨干部分能够有效地利用 LPIPS 损失函数,在各种已建立的基准测试中实现了最先进的图像质量(FI - En3D:从 2D 合成数据雕刻 3D 人体的增强生成模型
通过以人为基础的准确物理建模,我们提出了一种增强的生成方案 En3D,能够从合成的平衡、多样化和结构化的人类图像中,准确地模拟具有逼真外观的通用化 3D 人物。
- 扩散模型、图像超分辨率及其他:一项调查
本综述论文对应用于图像超分辨率的扩散模型(DMs)进行了概述,并进行了详细分析,强调了该领域的独特特征和方法论。它展示了 DM 基础知识的统一视角,并探索了包括替代输入域、条件策略、指导、失真空间和零样本方法等研究方向。此综述论文洞察了 D - QGFace: 基于质量指导的混合质量人脸识别联合训练
我们提出了一种新颖的质量引导联合训练方法,能够同时学习不同质量的图像,并基于质量分割,应用基于分类的方法学习高质量数据,以及应用自监督的图像 - 图像对比学习方法学习低质量图像。在多个数据集上的实验证明了我们提出的方法在识别不同质量的人脸图 - 个性化修复通过双轴调节
通过 Dual-Pivot Tuning 方法进行个性化修复,从而在保持普遍先验和每个组件的独特角色完整性的同时,实现对给定个体的面部特征准确表达和重建。个性化先验不仅在身份准确性方面优于最先进的通用先验,而且在图像质量方面也表现出色。