- 基于层次特征引导扩散的无监督单目深度估计
利用生成网络的训练策略,我们提出了一种在无监督单目深度估计中具有鲁棒性的扩散模型,并采用分层特征引导的去噪模块来丰富模型的学习能力,进一步探索了图像重投影中的隐式深度,并设计了一种隐式深度一致性损失,从而提高了模型的性能和深度在视频序列中的 - CTGAN:3D 形状的语义引导条件纹理生成器
本研究提出了基于语义指导的条件纹理生成器(CTGAN),用于生成具有与视角一致且尊重形状语义的高质量 3D 纹理,通过精细操作潜在编码实现对生成纹理的风格和结构的显式控制,并通过输入分割进一步增强对纹理结构的控制,实验证明 CTGAN 在多 - 语义通信的基本限制:速率失真的神经估计
该研究探讨了离散无记忆信道上语义通信的基本限制,采用语义速率失真函数分析最小压缩率、观测失真、语义失真和信道容量之间的关系。对于未知语义源分布的情况,提出了一种基于神经网络的方法来学习语义源分布,同时设计了级联神经网络来估计语义速率失真函数 - 通过双反投影网络进行任意点云上采样
3D 传感器获取的点云通常稀疏且嘈杂,点云上采样是一种提高点云密度以恢复详细几何信息的方法。本文提出了一种用于点云上采样的双重背投影网络(DBPnet)。通过采用上下上的方式进行双重背投影,网络不仅对特征残差进行反投影,还对坐标残差进行反投 - 基于粒子距离 GAN 的稳定性分析框架和 Wasserstein 梯度流
本文研究了使用基于粒子的距离作为目标函数的生成网络的训练过程,例如 MMD GAN、Cramér GAN、EIEG GAN,发现鉴别器训练不稳定的问题并通过在损失函数中添加稳定项来解决。
- 使用有条件训练的输入生成对抗网络从文本特征生成人脸
本文介绍了一种利用生成式对抗网络和自然语言处理模型生成人脸的新方法,将面部描述转换为可学习的潜在向量,从而生成与这些特征相对应的面部。
- 私有合成数据的迭代方法:统一框架和新方法
本文旨在研究关于隐私合成数据生成的算法框架,提出了两种新的算法:私有熵投影(PEP)和具有指数机制的生成网络(GEM),这些算法表现出比现有算法更好的性能。
- MMGAN 增强事件样本
这篇文章探讨了生成网络应用于粒子物理事件生成时的一个关键问题:生成的事件是否能够在训练样本的基础上增加统计精度。我们通过一个简单的例子展示了生成网络确实可以扩大训练统计,并且用放大因子或等效的样本事件数量量化了它们的影响。
- 生成式部分多视图聚类
本研究提出 GP-MVC 模型,通过生成缺失视图的数据来解决不完整的多视角聚类问题,使用多视角编码器网络和生成对抗网络学习共享表示和生成缺失数据,并利用加权自适应融合方案来利用不同视图的互补信息。通过实验证明,该方法在四个基准数据集上优于现 - CVPR使用图卷积网络实现从野外图像进行高保真度 3D 人脸重建
本文提出了一种利用图卷积网络从单视角图像中重建具有高保真度贴图的三维人脸形状的方法,并相对于其他的现有方法具有更好的定量和定性效果。
- 如何使用 GAN 消除探测器效应
本文介绍如何使用生成网络逆向模拟探测器效应等过程产生的事件,从而统计上反演蒙特卡罗模拟。此外,还介绍了最大均值失配损失如何被阶段性地或抑制地应用。
- 使用生成的图像训练模型的数据集不存在
利用生成网络产生的图像数据进行机器学习分类器的训练,本文提出了三种不同阶段的技术减少随机产生图像训练的不足,将其在 ImageNet 数据集上进行了检测,并相对于在实际数据上训练得到的分类器提供鼓舞人心的结果。
- CVPR使用深度先验进行神经盲反卷积
本文提出了两个生成网络分别为清晰图像和模糊核建模的深度先验,并提出了一种无约束神经优化解决盲解卷积问题的方法 SelfDeblur,实验结果表明相较于现有的盲解卷积方法,SelfDeblur 在定量和视觉上都取得了令人瞩目的成果。
- 位置归一化
本文提出了一种基于通道归一化的激活值归一化方法,通过提取特征在图像位置的一阶和二阶矩来捕获输入图像和抽取特征的结构信息,并将归一化常数重新注入后续层以保留或转移结构信息在生成网络中。
- ICML通过明确的 Wasserstein 最小化,逐步半离散地训练生成网络的方法
本文提供一种简单的过程,用于将生成网络适配成目标分布,从而实现小的 Wasserstein 距离,从而逐渐将生成器网络调整为目标分布。在 MNIST 和 Thin-8 数据的训练和测试集上,实现了良好的性能。
- 网络视频中的动作转移:跳舞生成
本文提出了一种利用计算方法在不同人之间传递身体动作的技术,基于生成网络,可以通过单个网络视频训练个人模型并生成具有照片级真实感的虚拟影像。
- AAAIMVPNet:用于从单张图像重建三维物体的多视图点回归网络
该论文提出了一种基于点云的物体表面重建方法,使用编码器 - 解码器网络通过单张图片生成多种视角下的点云,并且使用几何损失函数提高表面拟合准确性。
- 生成网络中的尺寸 - 噪声权衡
本文研究了基于生成网络将其输入噪声分布转换为其他分布的能力,提出通过实现一个基于迭代帐篷映射的 “填充空间” 函数来增加 ReLU 网络的噪声分布维数,使用泰勒级数逼近和二分搜索工具来计算函数反,从而提供了通过少量节点快速传递单变量均匀和正 - 生成网络中最后一层的批标准化
本文研究了 Generative Networks 的训练问题,发现在最终 generator 的层里使用 Batch Normalization 有利于快速训练,特别是将 Batch Normalization 放在最后一层的非线性激活函