- Arc2Face:人脸的基础模型
Arc2Face 是一个基于身份条件的人脸生成模型,它能够生成具有无与伦比的脸部相似度的多样化的照片逼真图像,通过将 ArcFace 的嵌入用于生成过程,并依赖于人脸识别特征的压缩性来指导生成过程。
- FlashAvatar: 高保真数码化身渲染实现 300FPS
提出了 FlashAvatar,一种新颖而轻量级的 3D 可动画化的化身表示方法,可以在几分钟内从短的单目视频序列中重建数字化化身,并在消费级 GPU 上以 300FPS 的速度渲染高保真度的照片级逼真图像。
- ICCVRenderIH: 一个用于 3D 交互式手势姿势估计的大规模合成数据集
为了提高手部姿势估计的准确性,研究提出了一个大规模的合成数据集 RenderIH,其中包含 100 万张具有不同背景、视角和手部纹理的逼真照片。为了生成自然和多样化的交互姿势,提出了一种新的姿势优化算法。而用于姿势估计的基于 Transfo - 反转逆向:基于范例的素描转照片综合,通过随机微分方程无需训练
通过形状增强反转和全控反转的两阶段方法,在例子为基础的素描到照片合成中生成逼真的彩色和纹理的照片。
- 绕过文本到图像生成模型的概念消除方法
从文本到图像生成模型到 AI 安全的概念消除方法,这篇论文研究了五种最近提出的概念消除方法,并展示了这些方法中没有一个能完全抹除目标概念,并通过利用特殊的学习词嵌入证明了目标概念可以从消除后的模型中找回,这突显了事后概念消除方法的脆弱性,并 - 扩散模型生成的合成数据是否适用于知识蒸馏?
本文研究了在没有真实图像的情况下,使用最先进的扩散模型生成的合成图像是否适用于知识蒸馏,并得出了三个关键结论:(1)扩散模型的合成数据可以在现有的合成蒸馏方法中轻松地实现最先进的性能;(2)低保真度合成图像是更好的教材;(3)相对较弱的分类 - CVPR动态高光物体的神经辐射场(NeRF-DS)
本文提出了一种基于动态神经辐射场的算法,通过表面的位置和朝向在观测空间中进行条件化,像素的渲染基于不同姿态下的表面反射的颜色来实现遮挡的效果,有效地改善了单目 RGB 视频中移动高光物体的重建质量。
- ICLR生成模型合成数据是否可以用于图像识别?
本文针对最新的文本到图像生成模型产生高保真类照片的现象进行了研究,详细探讨了这些合成图像在识别任务中的可行性和应用前景,并提出了针对数据缺乏情况和大规模模型预训练的综合应用策略。
- MMARMANI: 统一的跨模态时装设计中零件级服装 - 文本对齐
本文提出了一种新的跨模态时尚图像合成方法 ——MaskCLIP,并进一步构建了一个名为 ARMANI 的统一交叉模态时尚设计师,它能够根据真实图像的控制信号分布对其进行图像合成,且在多项合成任务中表现出色,生成的图像效果逼真自然。
- CVPR通过提取外观流实现无需解析器的虚拟试穿
本研究提出一种新方法 --“师父 - 导师 - 学生” 知识蒸馏,以解决图像虚拟试穿中的差错分割导致的视觉伪影问题,通过提取真实人物图像中的 “导师知识” 和虚拟试穿图像产生的 “辅导知识”,形成密集的对应关系,显著提高了试穿效果,更具有实 - AAAI光谱分布感知图像生成
本文提出使用谱鉴别器按照真实数据的频率分布生成图像,以解决当前深度生成模型中图像易被识别的问题。谱鉴别器具有轻量、模块化等特点,可以有效改进生成图片的频谱,提升模型性能。
- 频域图像翻译:更逼真的照片,更好的保持身份
该研究提出了一种基于频域的图像翻译框架(FDIT),能够保留源领域的标志性特征,生成视觉质量更优且类真实的图像。
- MM循环中的循环生成对抗网络用于关键点引导的图像生成
提出 C2GAN,一种新型循环生成对抗网络,用于关键点引导的图像生成,图像生成器和关键点生成器相互交错地连接在一个可端到端学习的框架中,并形成三个循环子网络,可生成更加逼真的图像。
- CVPR基于样例引导的人脸图像超分辨率重构算法无需面部标志点
本文提出了基于卷积神经网络的超分辨率解决方案,即 GWAInet,用于对由另一个未约束的高分辨率人脸图像引导的人脸图像进行 8x 超分辨率,该方法不需要面部关键点进行训练,具有很强的鲁棒性,并可以以均匀的方式产生周围面部区域的精细细节,其可 - ICLR通过无监督的几何蒸馏解开内容和风格
本文提出了一种创新的框架,利用两个分支的自编码器来学习内容和风格分离的表征,并通过多个损失约束辅助无监督学习,最终生成清晰、高质量的 256*256 分辨率的图片。
- CVPR文本到图像生成的语义分离
该文提出了一种新的文本图像生成模型,使用基于语义的标准化处理和图像嵌入策略来实现高水平的语义一致性和低水平的语义多样性,并在 CUB 和 MS-COCO 数据集上展示了其优异性能。
- CVPR任意姿态下无监督人物图像合成
本文提出了一种使用生成式对抗学习的新方法,用于综合产生任意姿势的具有照片级真实感的人物图像。研究通过无监督的方式来处理此问题,并且将其分解成两个主要子任务,一是姿势条件的双向生成器,二是定义一个新型的损失函数,包含内容和风格项,旨在生成高感 - MC-GAN:多条件生成对抗网络用于图像合成
本文提出了一种新方法,为生成目标图像,通过掌握给定背景信息,由文本属性生成目标物体图像,特别关注了控制物体和背景信息总和的多条件生成对抗网络方法(MC-GAN),在训练阶段通过生成物体和背景信息的合成块来实现。文中应用于实验,如 Calte - ECCV基于条件生成对抗网络的语音驱动人脸再现
利用递归神经网络和条件生成对抗网络,根据音频输入生成具有准确口型同步的逼真面部图像。
- StackGAN++:堆叠生成对抗网络实现逼真图像合成
本文提出了堆叠式生成式对抗网络 (Stackgan),该网络采用两个阶段和多个生成器和判别器构成的树状结构,用于高分辨率、逼真的图像生成。经过大量实验验证,该网络在生成逼真图像方面表现优于其他方法。