- 基于 Transformer 的时间序列合成综述
在图像和语言领域,生成式人工智能已经引起了很大关注,使用转换器神经网络持续主导最新技术。然而,将这些模型应用于时间序列生成的研究尚不充分,而这对于机器学习、隐私保护和可解释性研究具有极大的实用价值。本综述通过识别转换器、生成式人工智能和时间 - 无需训练数据集的条件生成对抗网络
给定一个无限制的预训练生成网络和一个预训练分类器,通过不依赖于任何训练数据集,开发一个条件生成器是否可行?
- 可视化和绘制 GAN 激活
我们研究了 GAN 生成的结构与它们在隐藏层中的激活之间的相关性,目的是更好地理解这些模型的内在机制,并能够使用无条件训练的 GAN 绘制结构。这使我们能够更好地控制生成的图像,可以根据语义分割图生成它们,而不需要在训练数据中包含该分割。为 - 利用 GAN 增强医学图像从有限数据中合成逼真图像
通过引入生成对抗网络(GANs)的创新方法,我们提出了一种合成医学图像的方法,通过深度卷积神经网络(CNNs)架构的生成器和鉴别器网络以及对抗训练方法,即使在有限的真实医学图像数据训练下,也能生成逼真的合成图像,并成功模拟了真实医学图像的结 - 利用 LSTM 和 GAN 进行现代恶意软件检测
该研究使用深度学习模型、LSTM 网络和 GAN 来提高恶意软件检测的准确性和速度,通过 VirusShare 数据集的训练和评估,表明深度学习在主动网络安全防御中发挥着决定性的作用。此外,研究还探讨了集成学习和模型融合方法对减少偏差和提高 - CharacterFactory: GANs 采样一致性字符用于扩散模型
在这项工作中,我们提出了 CharacterFactory,这是一个允许在 GAN 的潜在空间中采样具有一致身份的新字符的框架,并且设计了一个上下文一致性损失函数来确保生成的身份嵌入在不同上下文中能产生一致身份的图像。
- 基于参考的三元面 3D 感知图像编辑
通过对 EG3D 的三平面空间的探索和演示,本研究提供了一个集成框架,用于实现高质量的基于参考的三维感知图像编辑,并通过创新的流程在三维感知图像编辑方面呈现出独特的视角。
- CVPRCHAIN:通过利普希茨连续约束归一化增强数据高效 GAN 的泛化能力
我们的研究工作提出了 CHAINS(lipsCHitz 连续性约束归一化),以解决在有限数据情境下生成对抗网络(GANs)中判别器过拟合和训练不稳定的问题,并通过动态插值归一化和未归一化特征来有效避免判别器过拟合,该方法在 CIFAR-10 - GANTASTIC: 以 GAN 为基础的可解释方向传输在文本到图像扩散模型中的应用
通过将预训练的生成对抗网络(GAN)模型中代表特定、可控属性的方向转移至扩散模型中,GANTASTIC 提出了一种新颖的框架,既保持了扩散模型已知的生成质量和多样性,又显著增强了其进行精确、有针对性的图像编辑的能力。
- 仅需采样一次:通过自协同扩散生成对抗网络驯化单步文本到图像合成
YOSO 是一种新颖的生成模型,通过将扩散过程与 GANs 集成,实现快速、可扩展和高保真度的一步图像合成。我们展示了 YOSO 作为一步生成模型在从头开始的训练中具有竞争性能,并且可以扩展到通过 LoRA 微调高质量的一步文本到图像合成。 - 用于极端降尺度气候数据的生成对抗模型
使用基于生成对抗网络 (GANs) 的有条件 GAN 的 geospatial downscaling 方法,从低分辨率输入中生成高分辨率准确的气候数据集,并明确考虑了下尺度过程中的不确定性。
- 现代 GAN 模型的有趣特性
对现代生成对抗网络(GANs)的研究表明,其学习到的流形不符合训练分布,而且对超出分布的图片赋予更高密度,学到的潜在编码的先验与训练分布相去甚远,所用于训练 GANs 的图像集合通常不符合 GANs 的分布描述。
- VATr++:为手写文本生成明智选择您的字词
研究了手写体文本生成的影响因素,提出了输入准备和训练规范化策略,以获得更好的性能和更好的泛化能力,并提出了手写体文本生成的评估协议的标准化和全面的对比分析,推动该领域的进展。
- 通过在 GAN 的潜空间中寻找方向实现一次性神经人脸再现
本论文提出了一种神经面部 / 头部再现的框架,其目标是将目标面部的 3D 头部方向和表情转移到源面部。我们采用了不同的方法,通过使用(精调)预训练的生成对抗网络,绕过了学习嵌入网络以实现身份和头部姿态 / 表情分离的困难任务,以提高生成图像 - 生成模型的带注释手部数据
通过在训练图像中增加三个额外通道,我们提出了一种新的生成模型训练框架,大大提高了生成模型创建手图像的能力。我们通过在合成手图像数据集和包含手部的真实照片上展示了这种方法,并通过使用现成的手部检测器对指关节识别的置信度提高来衡量生成手部图像的 - GE-AdvGAN:基于梯度编辑的对抗生成模型改进对抗样本的可传递性
通过优化生成器参数的训练过程并引入梯度编辑机制,GE-AdvGAN 算法能够生成高度可迁移的对抗样本并在执行时间上与现有方法相比保持最小化。
- EGAIN: 扩展的 GAN 逆向
基于 EGAIN 架构的 GAN 逆向模型能够重构出真实面部图像的语义结构,具有优于现有模型的重建质量。
- AAAI利用其学习的流形上的局部密度结构压缩图像到图像翻译生成对抗网络
GAN 压缩方法从新的角度出发,通过在生成样本周围的局部邻域中保持原始模型的密度结构,提供了一种新的剪枝目标来规范剪枝模型,同时开发了一种协同剪枝方案,有效地在剪枝过程中保持生成器和判别器之间的平衡,从而展示出更稳定的剪枝动态。
- CVPR解锁预训练的图像骨干网络用于语义图像合成
提出了一种新型的基于特征骨干网络和交叉注意力机制的生成对抗网络(GAN)辨别器,用于语义图像合成,实现了在 ADE-20K,COCO-Stuff 和 Cityscapes 数据集上与输入标签地图的图像质量和一致性方面的最先进结果,相较于最近 - 深度生成模型对解决逆问题的表现如何?
本研究评估了基于扩散、基于 GAN 和基于 IMLE 的方法在三个反向问题上的性能,即 16 倍超分辨率、着色和图像解压。总体上,我们发现基于 IMLE 的 CHIMLE 方法在提供有效解决方案和可靠的不确定性估计方面优于其他方法。