- 达成同样动作:姿势引导的人体运动复制
人体运动复制是人工智能和计算机视觉中一个有趣且具有挑战性的任务,本研究通过在生成过程中引入感知损失、理论驱动的 Gromov-Wasserstein 损失和时域一致性,以及使用记忆模块,优化关键身体部位,从而实现模仿源视频中的运动并生成逼真 - SMCD:基于蛇毒扩散的高逼真运动风格转移
通过 Style Motion Conditioned Diffusion (SMCD) 框架和 Motion Style Mamba (MSM) 模块,解决了传统 GAN 方法在运动风格迁移中的不稳定性和收敛问题,并成功生成更加逼真的运动 - 使用卷积神经网络和胶囊网络进行可解释的深度伪造视频检测
通过使用卷积神经网络和胶囊网络与长短期记忆,利用可解释的人工智能来区分深度伪造生成的帧和原始帧,以实现我们的目标,并促进透明的人工智能关系并提供真实场景的实际示例。
- 利用拓扑先验增强点云生成技术
本研究提出了一种改进的 Sphere as Prior Generative Adversarial Network (SP-GAN) 模型,用于点云生成。该方法使用 K-means 算法将点云分割成聚类并提取质心,然后将质心作为先验用于 - GAN 的噪声维度:一种图像压缩视角
全球学术知名期刊报道了一项关于生成对抗网络(GAN)的研究,该研究提出了将 GAN 视为离散采样器的新观点,并建立了噪声维度与无损压缩图像所需比特数之间的关系。此外,还提出了一种新的分歧 - 熵权衡方法,用于揭示在噪声受限的情况下 GAN - C-GAIL: 使用控制理论稳定生成对抗模仿学习
Generative Adversarial Imitation Learning (GAIL) 使用强化学习来优化 GAN-like 判别器的奖励信号,但存在训练不稳定的问题。本文通过控制论分析 GAIL,提出一种新的控制器 'C-GAI - SpecDiff-GAN: 音频与音乐合成的频谱形状噪声扩散生成对抗网络
SpecDiff-GAN 是一种基于 HiFi-GAN 的神经声码器,通过高斯分布注入噪声到真实和虚假样本,以提高模型的训练稳定性,并利用频谱形状的噪声分布使鉴别器任务更具挑战性,实验证明该模型在语音和音乐合成方面在音频质量和效率方面相对于 - 基于遥感分割 - GAN - 扩散的公园绿地全过程生成设计框架
利用人工智能算法推动生成设计的发展在迅速进行。当前研究存在两个研究空白:1)大多数研究只关注设计元素之间的关系,对场地的外部信息关注较少;2)GAN 和其他传统的生成算法生成的结果分辨率低,细节不足。为了解决这两个问题,我们结合了 GAN、 - 高斯壳图在高效 3D 人体生成中的应用
使用高斯壳图作为框架,结合最新的 3D 高斯渲染基元与先进的生成器网络结构,我们提出了一种有效地生成 3D 数字人的方法,既能够用于 GAN 训练中,也能够在推理时将身体变形为任意预定义姿势,并实现高质量的多视图一致渲染。
- ARTEMIS: 使用多个判别器的 GAN 生成艺术
我们提出了一种新颖的生成抽象艺术的方法,通过训练自动编码器,提取源图像的风格表示,并使用生成对抗网络中的解码器作为生成器,结合多个鉴别器使生成器能够欺骗全部鉴别器,并最大化多样性项,最终生成具有超现实几何特性的图像。我们将其称为 ARTEM - 通过 Koopman VAEs 对规律和非规律时间序列数据的生成建模
基于 Koopman VAE 的新型生成框架,能够优化正常和不规则的时间序列数据,通过引入领域知识和动力系统理论工具,KVAE 在合成和真实时间序列生成基准测试中优于当前的 GAN 和 VAE 方法,并学习出更好地逼近实际分布的概率密度函数 - ICCV加速迭代扩散反演的有效真实图像编辑
使用生成对抗网络 (GAN) 和去噪扩散隐式模型 (DDIM) 的加速迭代扩散反演方法 (AIDI) 在图像编辑任务中取得了更高的重构准确性和更好的稳健性。
- ICCVStyleInV: 无条件视频生成的时态风格调制反演网络
我们介绍了一种新颖的基于学习的倒置网络的运动生成器设计,通过将边缘图像编码为潜在变量,再通过指导初始帧的倒置编码器,使我们的方法能够生成平滑的未来潜在变量,从而实现了生成长时间和高分辨率视频的优势。
- 物理引导的训练 GAN 提高气动翼型设计合成的准确性
通过物理引导训练生成对抗网络(GAN)模型,在不使用训练数据集的情况下,生成全新的形状,并且改善了现有 GAN 模型的准确性和物理有效性。
- 遮挡环境下的人物再识别网络:擦除、变换与添加噪音防御
该论文提出了一个简单而有效的框架,ETNDNet,来处理人物重识别中遮挡的问题,这个框架不需要任何外部模块,通过三种策略(随机擦除、随机变换和加入高斯噪声)来抵抗随机和遮挡噪声。的 GAN-based 对抗防御范例是第一个针对无法识别的人物 - AdAM: 自适应感知核调制的小样本图像生成
本文针对目前的 few-shot image generation 方法仅基于源域的知识选择而未考虑适应性,提出了一种适应性感知的 AdAM 方法,通过实验证明在多个领域的 FSIG 中均有最好的表现,应用前景广阔。
- ICLRFFPDG:快速、公正、私密数据生成
该研究提出一种快速、公平、灵活和私密的数据生成方法,通过理论和实验证明,使用该方法生成的数据训练的模型可以在真实应用场景中(推理阶段)表现良好。
- 一种简单有效的注意力生成对抗网络基准模型
通过改进背骨网络和损失集成方法提出了 SEAttnGAN,它是一种高质量图像到文本模型,可以通过引导生成模型来提高其性能和质量。
- 评估 GAN 生成的合成表格数据在类别平衡和低资源环境下的实用性
本研究旨在解决分类任务中不平衡数据的问题,并评估 SMOTE、ADASYN 和 GAN 技术在生成合成数据以解决类别不平衡和提高分类模型在低资源环境下的性能方面的适用性。
- 基于 Hourglass 块和 Early Stopping 鉴别器的 JPEG 最大有损压缩人脸图像恢复
本研究使用以 U-Net 为基础的 GAN 网络方法处理经最大压缩后,失真严重、难以识别的 JPEG 图像的恢复问题。通过新增 hourglass 结构和使用 LF Loss 与 HF Loss 两种损失函数,生成器成功欺诈判别器,生成自然