- CLIPAway:通过扩散模型协调焦点嵌入以移除对象
通过使用 CLIP embeddings 着重于背景区域并排除前景元素,提高修复精度和质量,实现无痕物体移除的新方法 CLIPAway。
- 去除神经辐射场中的深度先验
该论文研究了如何通过集成单目深度估计方法与 NeRF 模型,来显著降低时间消耗、提高场景生成和物体去除的鲁棒性和质量,并结合 KITTI 数据集验证了该方法的有效性。
- GScream: 学习三维几何和特征一致的高斯插值方法用于物体去除
通过使用三维高斯图案生成器更新辐射场,本研究论文解决了对象去除的复杂挑战,主要挑战在于在高斯图案的离散性质中保持几何一致性和纹理协调性。通过优化高斯图案的定位以提高去除区域和可见区域的几何一致性,再结合跨注意力设计的新颖特征传递机制来增强纹 - 使用类别化目标移除图像的目标消除性能评估方法
我们创建了一个带有目标去除真实值的数据集,比较了使用原始图像和使用目标去除真实值图像的当前方法评估的差异,验证了当前方法不适用于评估目标去除器的性能,并提出了一种新的经过量身定制的性能评估方法。通过类别化的目标去除结果以及与目标类别对象无关 - RefFusion:3D 场景修复的参考适应扩散模型
我们提出了一种基于多尺度个性化图像修复扩散模型的新型三维修复方法 RefFusion,通过引入参考图像,实现了对修复内容的显式控制,从而在保持高可控性的同时取得了最先进的物体去除效果。
- ObjectDrop:用于真实对象移除和插入的引导反事实
通过分析自我监督方法的局限性,我们提出了一种以 “反事实” 数据集为中心的实用解决方案,用于对扩散模型进行微调,实现不仅移除对象还能消除其对场景的影响,该方法在逼真的对象插入和去除方面显著优于以前的方法。
- 基于修复驱动的遮罩优化方法用于物体去除
本文提出了一种优化遮罩的方法,通过图像修复来提高对象去除的质量。通过使用分割提取的对象遮罩来训练修复网络,并在推断步骤中使用这些遮罩,解决了训练和推断图像之间的域差异问题。此外,通过连接分割网络和修复网络进行端到端训练,以改进修复性能,并通 - 一个任务价值千言:使用任务提示进行高质量、多用途的图像修复
通过引入可学习的任务提示符和定制的微调策略来指导模型对不同填补目标进行专注,我们提出了 PowerPaint,首个在上下文感知图像修复和文本引导下同时具有高质量和多功能修复能力的模型。我们在各种修复基准测试中对 PowerPaint 进行广 - OR-NeRF:由多视角分割指导的神经辐射场,用于删除 3D 场景中的对象
本文提出了一种名为 OR-NeRF 的新型对象移除流水线,它可以在单个视图上通过点或文本提示从 3D 场景中移除对象,并在更短的时间内实现更好的性能。
- AURA:基于随机输入采样的自动生成遮罩技术用于物体消除
该论文提出了一种基于可解释的人工智能 (XAI) 方法的自动输入遮罩生成器,可以更好地移除图像中的物体,并提出了 FID$^*$ 和 U-IDS$^*$ 等新的评估指标来适当评估物体移除器的质量。
- ICCV隐式长程传播内部视频修复
该论文提出了一种基于内部学习策略的视频修复框架,通过拟合卷积神经网络来替换未知区域,设计了两个规则项以保留高频细节和长期时间一致性,进一步将提出的方法扩展到学习从 4K 视频中给定单个对象的掩码来删除视频中的对象的挑战性任务。
- ECCVOneGAN:条件图像生成、前景分割和细粒度聚类的同时无监督学习
本研究提出了一种无需标注的无监督学习方法,结合了生成对抗网络和变分自编码器,实现了条件图像生成、前景分割、分级聚类、物体去除和背景补全等多项功能,并在相关任务上取得了最新的最优结果。
- CVPRVORNet: 对象移除的时空一致视频修复
本文提出了一种基于深度学习的视频物体移除网络(VORNet),该方法通过结合光流修补和基于图像修补模型的方法,在时空上保持稳定性,对生成的视频进行了客观和主观评估,结果表明与现有方法相比,我们的 VORNet 在时空上生成了更加稳定的视频。
- CVPR前景感知图像修复
该研究提出了一种有前景意识的图像修复系统,通过分离结构推断和内容完成,学习预测前景轮廓并利用预测的轮廓进行纹理填充。实验表明,该方法在处理复杂图像的同时,能够显著提高图像修复的性能。
- 不用汽车看路边:量化并控制上下文对分类和分割的影响
该研究论文中提出了一种量化黑盒视觉模型对视觉背景依赖性的方法,通过编辑图像并测量目标模型的响应,以发现物体与背景之间的不良依赖性,并提出基于物体去除的数据增强方案以缓解这种依赖性,从而提高分类和分割模型对环境变化的鲁棒性。