- 针对高分辨率图像合成的修复去噪扩散模型
我们提出了一种有效的去噪扩散模型,用于生成高分辨率图像 (例如 1024x512),该模型是在小尺寸图像块 (例如 64x64) 上训练的。我们的算法名为 Patch-DM,其中设计了一种新的特征拼贴策略,以避免合成大尺寸图像时的边界伪影。 - SuperInpaint:学习细节增强的注意力隐式表示进行超分辨率图像修复
通过引入细节增强的注意力隐式表示(DEAR)方法,该研究旨在解决低分辨率图像中的遗失区域恢复和生成任意高分辨率的图像,并通过使用单一模型在高质量完成的图像方面取得成功。
- 通过补丁选择实现人体姿势估计的高效视觉变换器
提出了一种用于减少 Vision Transformers 计算复杂度的简单方法,通过选择和处理最有信息的小片段,我们将二维人体姿态估计网络的结果作为指导进行小片段的选择,实验结果表明这种方法在显著提高速度和减少计算复杂度方面非常有效,而且 - 学习差分隐私概率模型保护隐私的图像生成
本文提出一种学习差分隐私概率模型(DPPM),用于生成具有差分隐私保证的高分辨率图像,通过训练模型以适合训练数据的分布并在过程中执行随机响应机制,然后进行哈密顿动力学采样以及由训练概率模型预测的差分隐私运动方向,以获得保护隐私信息的图像,相 - 使用扩散桥对流体流动进行非配对下采样
本文提出了使用基于扩散映射的生成模型来降低理想地球物理流体模拟的方法,生成高分辨率图像,避免额外的校准或培训,并适用于多个源和目标域的组合,而不需要训练新模型。
- 二元潜在扩散
本文基于自动编码器训练了一个伯努利编码分布的二元潜空间模型,用于图像压缩和高分辨率图像生成。结果表明该方法无需使用多级层次结构即可大幅提高采样效率,生成的图像质量好且效果与现有先进方法相当。
- 自动高分辨率电线分割和去除
本文提出了一种自动电线清理系统,可以在几秒钟内准确、高效地对高分辨率图像中的电线进行分割和去除,并介绍了第一个电线分割基准数据集 WireSegHR。通过定量和定性的实验,证明了该系统能够自动清除电线并具有良好的泛化性。
- CVPR文本到图像合成的 GAN 扩展
本文提出了一种新的 GAN 架构 GigaGAN,用于文本到图像合成,并比较了其与传统的 GANs 和 DALL-E2 的性能,结果表明 GigaGAN 可以快速且高质量地合成高分辨率图像。
- 高分辨率图像物体检测的粗细粒度框架
本文提出一种基于聚类的粗到细的目标检测框架,特别针对小物体和高分辨率图像的大规模差异问题,在提高目标检测准确率的同时降低了计算成本。
- CVPRBooster: 一个透明和有反射表面深度图像基准测试
通过使用深度空时立体框架生成新数据集,对透镜畸变下的高分辨率图像进行了深度估计,同时提供了手动注释的材料分割掩模和 15K 个未标记的样本。
- ICLR高分辨率图像识别的迭代补丁选择
提出一种名为 Iterative Patch Selection (IPS) 的简单方法,该方法仅选择最显着的补丁,将其聚合成用于图像识别的全局表示,从而可以在硬件限制下处理任意大小的图像,展现出强大的性能和广泛的适用性,同时使用最少的加速 - ECCVArtFacePoints:绘画与印刷品中的高分辨率面部关键点检测
该论文提出了一种基于深度学习的方法,用于在高分辨率的艺术品图像中检测面部特征点,将任务分为全局网络和多个区域网络,并且该方法在艺术品高分辨率数据集上证明了较高的准确性。
- NUWA-Infinity:无限视觉合成的自回归生成
该论文提出了 NUWA-Infinity,这是一个无限生成视觉图像或视频的生成模型,它利用基于补丁级别的自回归模型和基于标记级别的自回归模型并引入了近邻上下文池和任意方向控制器来提高图像和视频的生成质量。
- Harmonizer: 学习执行白盒图像和视频协调
将图像合成执行为图像级回归问题,使用神经网络预测滤镜参数,结合高效的白盒滤镜逼真地生成合成图像,实现了高分辨率图像的快速处理,稳定且优于现有方法的多个实验效果,并在视频合成中成功应用。
- ASSET:使用 Transformer 进行高分辨率自回归语义场景编辑
使用基于注意力机制的 transformer 神经网络架构 ASSET 对高清晰度图像进行语义分割地图的自动合成修正,并证明其在应对高清晰度图像的长距离互动和上下文处理能力方面优越于传统神经网络和 transformer 方法。
- CVPRMAT: 大洞图像修复的掩模感知 Transformer
本文提出了一种基于 transformer 的大孔修复模型,它结合了大尺寸的图像处理和 transformer 的优势,通过在注意力模块中定制面向修复的 transformer 块并使用动态掩码来聚合非局部信息,得到了在多个基准数据集上最先 - 结构增强图像超分辨率的梯度方差损失
本文提出了一种名为 Gradient Variance (GV) loss 的结构增强的损失函数,用于训练模型生成高分辨率图像,以解决使用 L1 或 L2 损失函数时模型无法恢复高分辨率图像中锐利边缘的问题。实验结果表明,GV 损失可以显著 - ScaleCert:具有稀疏浅层的可扩展认证抵御对抗性补丁
提出在高分辨率图像上实现高可证明鲁棒性的认证防御方法,减少敌对区域的搜索开销和过滤预测噪声,从而通过利用重要神经元的本地化性质增强了认证准确性。
- CVPRQueryDet:级联稀疏查询加速高分辨率小目标检测
在对象检测领域,提出了 QueryDet 算法,使用了新颖的查询机制来加速基于特征金字塔的对象检测器的推理速度,既可以收获高分辨率特征图的好处,又可以避免背景区域的无用计算,从而在保证精度的前提下提高了推理速度。
- 驯服 Transformer 的高分辨率图像合成
结合卷积神经网络与 transformers 模型的特点,实现了生成高分辨率图像的任务,并取得了 ImageNet 中类别有条件下的自回归模型的最优结果