- 基于自编码器的消除伪相关性方法
通过自动编码器方法分析了 Global Wheat Head Detection(GWHD)2021 数据集中存在的错误关联,并使用修复和加权盒融合方法成功提高了平均域准确率(ADA),证明了该方法能够抑制部分 GWHD 2021 数据集中 - CLIPAway:通过扩散模型协调焦点嵌入以移除对象
通过使用 CLIP embeddings 着重于背景区域并排除前景元素,提高修复精度和质量,实现无痕物体移除的新方法 CLIPAway。
- 用潜在扩散在腰椎核磁共振图像中修复病理缺损
通过沿用高阶无噪音 LVGHD(三维)均一化成训练数据的分量,实现了数据的复制与修复,有助于预测分化格里马右半球的单元。
- 视频减少现实修复下的优化 ProPainter
在这篇论文中,我们介绍了一种从 ProPainter 方法优化而来的视频修复技术,以满足口腔颌面外科医学图像的特殊需求。我们的增强算法采用了零样本的 ProPainter,具有优化的参数和预处理,能够熟练处理手术视频序列的修复任务,而不需要 - 通过跨多样背景修复和伪蒙版细化来推广息肉分割
利用稳定扩散修复和控制网络的预训练模型,建立了一个强大的生成模型,在不同背景下修复息肉;借助修复区域引导的伪掩模精化网络来改善准确性;采用样本选择策略优化模型,最终模型表现优于基准方法,改进数据增强策略提高息肉分割模型性能,具有与全监督训练 - 用于城市街景图像的多尺度语义先验特征引导深度神经网络
这篇论文介绍了一种深度神经网络(DNN),多尺度语义先验特征引导图像修复网络(MFN),用于修补街景图像,以实现隐私保护并为城市应用生成可靠场景。
- 点重采样与射线转换辅助可编辑的 NeRF 模型
我们提出了一种基于 NeRF 的编辑任务方法,通过隐式光线变换策略和不可区分的神经点重采样(DNR)模块来解决物体移动和填补空白区域的挑战,构建了一个点云可编辑的 NeRF 系统 PR^2T-NeRF,实验结果表明我们的系统在物体移动和填补 - CVPR室内全景自动去除家具
提出了一种利用稳定扩散的流程来改进室内全景图像中家具移除的修复结果,通过增加上下文、领域特定模型微调和改进的图像融合,产生几何可信的高保真修复效果,无需依赖于房间布局估计,展示了相对其他家具移除技术的定性和定量改进。
- 学习通过首先移除图像对象来添加图像对象的绘画
通过利用分割蒙版数据集和在蒙版内修复的修复模型,我们可以实现自动逆向修复过程,将对象添加到图像中,在没有用户提供的输入蒙版的情况下,提供了一种无缝地根据文本指令添加对象的方法。
- InFusion: 基于扩散先验学习深度完成的三维高斯填充
通过使用图像条件的深度完成模型引导点的初始化,本研究提出了一种名为 InFusion 的方法,它能够更准确地补全 3D 高斯空间中的点,从而在各种复杂情况下提供更好的保真度和效率。
- 神经辐射场修复的潜在扩散模型驯服
我们提出了一种新的框架,通过对扩散模型的温和性进行个性化设置并使用掩蔽对抗训练来缓解图像条件中的文本移位问题,从而解决了使用 NeRF 进行重建时遇到的几个问题,并在各种真实场景上实现了最先进的 NeRF 修复结果。
- HySim: 图像修复中的快速混合相似度度量方法
本研究提出了一种基于基于补丁技术的改进型模型驱动方法,通过引入混合相似度(HySim)来增强补丁选择,从而实现了高质量的图像修复成果。实验结果证明,与其他模型驱动技术相比,该方法在实现视觉上令人满意的修复方面表现出了显著的效果。
- InTeX: 统一深度感知修复的交互式文本生成纹理方法
InteX 是一种用于交互式文本到纹理合成的新框架,通过用户友好的界面和统一的深度感知修复模型,解决了现有方法中存在的 3D 不一致性和可控性有限的问题,证明了其在高质量 3D 内容创作方面的实用性和有效性。
- 通过后验采样解决一般有噪音的逆问题:一种策略梯度视角
使用预训练扩散生成模型以输入图像为指导,通过 Diffusion Policy Gradient 方法精确估计输入图像的指导评分函数,解决多种线性和非线性反问题,并在 FFHQ、ImageNet 和 LSUN 数据集上实现更高的图像恢复质量 - 窗口傅立叶混合器:利用傅立叶变换增强无杂波空间建模
基于 U-Former 架构和新的 Windowed-FourierMixer 块的创新方法,用于从单个图像中修复室内环境,以在模拟内部空间的结构,创造纹理丰富且无杂乱的重建。
- ARIN:用于敦煌莫高窟壁画鲁棒盲目修复的自适应重采样和实例归一化
通過修改現有的兩種方法(CAR,HINet),我們在數碼化的敦煌石窟壁畫上實現了成功的壁畫修復和增強,其中一種方法(HINet)超過了敦煌挑戰的第一名,而我們結合的方法(ARIN)在噪聲方面表現出色,與第一名相媲美。
- 扩散后验抽样的计算难题
传播模型、后验抽样、测量模型、修复图像、指数级时间拒绝抽样是本研究的主要关键词及研究领域。
- HI-GAN: 层次修复生成对抗网络用于合并的 RGB 和深度修复
我们提出了一种新的分层修复 GAN(HI-GAN),它由三个 GAN 组成,EdgeGAN 和 LabelGAN 分别修复边缘图像和分割标签图像,而 CombinedRGBD-GAN 则结合它们的潜在输出并进行 RGB 和深度修复,同时边缘 - 对光场数据进行正常图修复
本研究介绍了一种使用生成对抗网络(GAN)修复法线贴图的新方法,该方法通过推断生成虚拟数据,并结合了损失函数的修改以适应特定的数据特征,实现了高质量逼真的修复结果,适用于表演捕捉等应用。
- Re:Draw-- 上下文感知翻译作为艺术创作的可控方法
介绍了一种上下文感知翻译方法,将修补和图像转换的优点相结合,同时尊重原始输入和上下文相关性,为艺术创作中 AI 的可控使用开辟了新途径。作为一个应用案例,我们将该方法应用于根据任何设计规范重绘任何手绘动画角色的眼睛 - 眼睛作为吸引观众注意