- ASAP: 可解释性 AI 生成图像模式的大规模分析与总结
利用 ASAP 在 AI 生成的图像中自动提取与欺骗模式相关的突出特点,并通过各种视图进行交互式探索。
- 揭示生成图像检测数据集中的常见偏差:伪造还是 JPEG?
该研究讨论了使用生成图像模型检测人工内容的紧迫性,并指出当前的数据集中存在与 JPEG 压缩和图像大小相关的偏差。研究还展示了去除这些偏差对 JPEG 压缩的鲁棒性和评估检测器的不同生成器间性能的显著影响,其中 ResNet50 和 Swi - 高效生成高分辨率图像的 Token 下采样策略
提出了一种密集注意力的训练无关方法以加速稳定扩散推理的进行,通过关键和值令牌的降采样,在常见尺寸和高分辨率下可以将推理速度提高 2 倍或更多,证明了该方法在平衡高效吞吐量和保真度方面优于之前的方法。
- SCoFT:自反对细调均衡图像生成
通过与社区合作收集一种名为跨文化理解基准(CCUB)的代表文化的数据集,并提出了一种新颖的自对比微调(SCoFT)方法,改善生成图像中的包容性表示,并通过模型的已知偏见进行自我改进。
- 自耗生成模型疯狂前进
该论文使用最先进的生成图像模型对三种不同类型的自噬循环进行了彻底的分析和实证研究,发现如果每个世代没有足够的新真实数据,未来的生成模型的质量或多样性将逐渐降低,这种情况被称为 ' 模型自噬障碍 '(MAD)。
- 具有计划抽样的 Markup-to-Image 扩散模型
基于扩散模型的数据驱动方法实现了将 Markup 转换为图像,通过实验验证了扩散过程的有效性以及调度采样算法的调整作用,同时标记到图像的任务提供了一个有用的受控组合环境,进行生成式图像模型的诊断和分析。
- ECCV通过种族视角研究 GAN 中的偏差
本研究探讨生成图像模型的表现和评估如何受其训练数据集的种族组成的影响。研究发现,虽然生成的图像的种族组成成功地保存了训练数据的种族组成,但在推理过程中采用的截断技术会加剧数据中的种族不平衡。此外,研究还发现,对于给定种族,注释者倾向于喜欢种 - Einsum Networks: 可计算概率电路的快速可扩展学习
本文提出了基于 Einsum Networks 的概率电路模型实现,通过简化 Expectation-Maximization 算法的实现以及在数据集上的应用来提高其可扩展性,并且作为一种忠实的生成图像模型。
- 人眼注视期间视觉搜索目标的视觉解码
研究使用深度卷积神经网络和生成式图像模型将人类注视视线信息解码成视觉目标的图像表示,结果显示出 62% 的准确率
- ICML使用辅助变量的 PixelCNN 模型进行自然图像建模
本论文探讨自然图像的概率模型,并通过引入辅助变量扩展了 PixelCNN 架构家族的自回归模型,提出了两个新的基于不同图像转换的生成式图像模型,包括图像的分辨率金字塔。该模型解决了现有 PixelCNN 模型的两个已知缺点,并表明其产生的图 - NIPSGANs 的改进生成器目标
本文提出了一种 GAN 训练的解释框架,将其理解为交替的密度比率估计和近似的差异最小化,并解释了实践中常用的 GAN 生成器和鉴别器目标的不匹配问题以及样本多样性不足的问题,并推导出一组生成器目标,旨在针对任意 $f$- 散度而不是最小化下 - 基于内视对抗网络的神经图片编辑
该论文介绍了一种利用神经生成网络在现有图像上进行大规模、语义连贯的变化的交互式接口,并通过多种图像数据验证了 Introspective Adversarial Network 及其组成部分 (weight-shared dilated c - 利用空间 LSTMs 生成图像模型
本文中介绍了一种基于多维 LSTM 的递归图像模型,该模型可以捕获长距离像素之间的统计依赖,适用于纹理合成和补全等多项任务,并在多个图像数据集上的定量比较中表现优异。