- 将潜在空间与图像空间对齐,以连接不可连接之物
本文提出了一种使用具有完全等变性的生成器在图像和潜在空间中进行同步插值的方法,利用修改过的 AdaIN 机制来训练生成器以在任意两个潜在向量之间生成图像,使用 LHQ、LSUN Tower 和 LSUN Bridge 数据集测试,结果表明本 - ICLR带有优化熵编码的学习变换压缩
该论文探讨了学习变换压缩的问题,使用了软量化操作和矢量量化方法,以及通过直接优化编码熵来实现对编码概率分配的松弛操作,通过实验验证了该方法的潜力。
- In&Out: 通过 GAN 反演实现多样化的图像出油画
本研究提出了一种基于生成式对抗网络的图像拓展方法,通过对多个潜在编码的生成进行条件渲染,实现了对图像的多样化拓展,并可对分类输入进行拓展,其拓展区域结构和内容更加丰富,表现出更高的视觉质量和多样性。
- CVPRDivCo: 基于对比式生成对抗网络的多样化条件图像合成
本研究提出了 DivCo 框架,使用对比学习(contrastive learning)约束生成图像之间的正 (positive) 和负 (negative) 关系,实现条件生成对抗网络 (cGANs) 的多样性图像合成。实验结果显示,Di - CVPR神经身体:使用结构化潜在编码的隐式神经表示,用于动态人体新视角综合
本文提出了 Neural Body,一种人体新的神经表示方法,通过假设不同帧的学习神经表示共享相同的潜在代码来集成视频帧之间的观察,从而解决了高度稀疏的视图的表征学习问题,并在多视点数据集 ZJU-MoCap 上得到了验证。
- ICLR基于可微分渲染的图像 GAN 逆向图形学和可解释的 3D 神经渲染
本文利用可微分渲染器提取并分离生成模型中的 3D 知识,将生成对抗网络作为多视图数据生成器,使用现成的可微分渲染器训练逆向图形网络,并将训练好的逆向图形网络作为教师,将 GAN 的潜在向量分离为可解释的 3D 属性。我们的方法在现有数据集上 - ECCVDeepLandscape:风景视频的对抗建模
本文利用模型 StyleGAN 对风景视频进行训练,生成真实的时间变化风景视频,并通过拟合到静态风景图像中实现再现,同时提出简单的 StyleGAN 反演过程改进,生成比以前更引人注目的风景动画。
- CVPRDOPS: 学习检测三维物体并预测它们的三维形状
我们提出了一种名为 DOPS 的快速单级 3D 物体检测方法,其核心创新点是一种快速、单次遍历的体系结构,同时检测 3D 物体并估计其形状。该方法通过图卷积进行聚合,并将 3D 边界框参数传入网络分支以预测表示每个检测到的物体形状的潜变量代 - ECCV深度局部形状:学习本地 SDF 先验用于详细三维重建
利用 Deep Local Shapes 技术实现高质量 3D 形状的编码与重建,将场景分解成局部形状以降低模型的复杂度和提高推导效率。
- 通过特征操纵生成语义对抗样本
本文提出了一种实用的针对深度神经网络的对抗攻击方法,通过语义意义感知的结构化扰动来操纵图像的语义属性,以此生成针对黑盒分类器的对抗扰动,并提出了两种无监督的语义操作方法,通过在潜在空间中扰动单个或多个潜在因素,并在真实图像数据上进行大量实验 - 分析并提高 StyleGAN 的图像质量
使用改进的模型结构和训练方法,对 StyleGAN 生成器的规范化、进化成长和正则化进行了重新设计,并引入了路径长度正则化器,以改善图像质量和生成器的可逆属性。通过可视化生成器对其输出分辨率的使用情况,识别容量问题并进行大规模模型的训练,使 - 深度生成表示中出现了场景生成的语义层次结构
本研究说明了 State-of-the-art GAN 模型中,高度结构化的语义层次结构从生成性表示中出现作为变化因素,并证明了 GANs 学习到的生成性表示是专门用于合成不同的层次语义。
- MM噪声对比变分自编码器
本文理论上探索了几种流行的变分自编码模型,在启发于噪声对比评估算法的基础上,提出了一种新的算法 NC-VAE,在数据重构能力上不会出现后验崩溃问题,提供了新的下界,并在图像和文本数据集上进行了实证展示。
- 低秩视频表示与重建的生成模型
本文提出了一种基于生成模型的视频压缩表示方法,它可以通过学习紧凑的潜在代码有效地表示和重构视频序列,并且在使用邻节点潜在代码的低秩和相似性约束进行正则化的情况下,可以从不同压缩率下的压缩测量中恢复各种视频信息。
- 对抗逼近自编码器用于图像生成和操作
本文提出了一种新方法,即采用对抗逼近自动编码器(AAAE)来研究具有对抗逼近的潜在代码,从而提高重建质量并学习具有流形结构的潜在空间,同时不需要对潜在代码进行正则化。
- ACL基于多级潜变量模型生成长且连贯的文本
本文研究了多层结构的变分自编码器模型,采用层级随机层和多层解码器结构生成更具信息的潜变量编码,同时生成中间的句子表示作为高层计划向量,实验结果表明多层结构能够生成更加连贯且不重复的长文本,并进一步缓解了后验坍缩问题。
- 采用对抗训练方法学习图嵌入
该论文提出了一个新的对手正则化框架来进行图嵌入,通过对手正则化的方法来保证所得到的隐藏代码满足先验高斯或均匀分布,之后得到两个 Adversarially Regularized Graph Autoencoder (ARGA) 和 Adv - 通过对抗正则化器理解和改善自编码器中的插值
本文提出了一个鼓励自编码器进行中间值重构的惯化机制,并通过一个简单的基准测试任务和经验证明,表明我们的惯化机制极大地改善了在这种情况下的插值能力,并产生对下游任务更有效的潜在代码。
- ICLR生成对抗网络的潜空间的语义分解
本研究提出一种新的算法用于训练生成式对抗网络,并联合学习身份(例如个人)和观察(例如具体照片)的潜在代码。我们使用成对的训练模式,可生成多样的相同主题图像,并保持灯光和姿势等相关方面的特征,进而提高图像的真实感。结果表明,基于 Siames