- 医学图像的形状感知半监督三维语义分割
本研究提出新型的半监督学习策略来提高医学图像分割的形状估计性能,该方法采用多任务深度网络来同时预测语义分割和物体表面有符号距离图,并通过敌对损失来有效地捕捉形态感知特征.
- ECCV学习视频修复的联合时空变换
本篇论文提出了一种基于自注意力机制和空间 - 时间转换网络的视频修复方法,通过对所有输入帧进行自注意力填充缺失区域,并提出利用空间 - 时间对抗损失进行优化的方法,从而在定量和定性方面证明了该模型的优越性。
- ECCV不必掩盖不必要的部分:无需解析器的虚拟试穿
本文提出一种新的学生 - 教师模型来解决 2D 虚拟试穿任务中的监督学习问题,并且减少了图像处理的开销,从而实现了实时虚拟试穿。
- 自然视频中大幅度改变帧的照片真实视频预测
通过使用深度残差网络结构,利用分层预测和自上而下的连接方法,结合对抗和感性代价函数,提高了基于视频预测的性能以及更真实的图像细节和纹理,特别是在快速相机运动下,未来视频帧的预测性能优于现有基线。
- PF-Net:用于 3D 点云补全的点分形网络
本文提出了基于点分形网络的学习方法 Point Fractal Network(PF-Net),用于精确高保真度的点云补全,通过多尺度生成网络进行缺失点云的预测。同时,通过多阶段的补全误差和对抗损失来生成更真实的缺失区域,实验证明了该方法的 - CVPR针对深度人脸识别的通用表示学习
本文提出了一种通用表征学习框架来提高人脸识别的性能,包括合成训练数据、分割特征嵌入、用不同自信值调整训练的过程,以及通过正则化分类和对不同划分的变体进行对抗训练损失来减少相关性。实验结果表明,该方法在 LFW 和 Megaface 等人脸识 - ICLRCycleGAN 核心作为一种主要的齐次空间
本文针对图像风格迁移的 CycleGAN 方法,通过理论分析和实验结果,探索图像翻译中自动同构的新奇现象,并得出无法通过寻求最优解来使图像翻译达成目的的结论。
- 为什么我不能在商场跳舞?学习减缓动作识别中的场景偏见
我们提出了一种减轻场景偏差从而实现视频表示学习的方法,通过在行动分类的交叉熵损失中增加场景类型的对抗性损失和关于人类角色面罩混淆的损失,来鼓励学习能够在没有证据时无法预测场景类型和正确的行动的表示。我们的结果表明,相对于没有进行去偏置处理的 - ICCVPU-GAN: 点云上采样对抗网络
本文提出了一种基于生成对抗网络(GAN)模型的新的点云上采样网络 PU-GAN,能够从潜在空间中学习到丰富的点分布并通过误差反馈和自校正实现对物体表面上的点的上采样,并通过鉴别器学习更多潜在模式以增强输出点的分布均匀性。定量和定性评估表明, - 基于注意力引导的生成对抗网络的无监督图像转换
本文提出了基于注意力机制的生成对抗网络 AGGAN,在生成图像时使用内置的注意力机制检测最具有辨别性的语义部分并最小化不需要的部分的变化,训练过程中同时考虑对抗损失、循环一致性损失、像素损失和注意力损失,实验表明 AGGAN 比现有模型能够 - ICLRMMA 训练:通过对抗训练直接输入空间边际最大化
该研究从最大化边界的角度研究了神经网络的对抗鲁棒性,并提出了 Max-Margin Adversarial(MMA)训练方法,以直接最大化边界来实现对抗鲁棒性,通过该方法在 MNIST 和 CIFAR10 数据集中实现了 robust 性
- CVPRZoom-In-to-Check: 基于实例级别区分的视频插帧增强
我们提出了一种轻量级视频帧插值算法,通过实例级监督进行学习,使用光流变形和图像合成模块生成中间图像,并结合低分辨率目标物体和对高分辨率目标物体进行对抗性逆向训练得到的损失,对图像中的细节进行实例级精细化纠正,最终得到与竞争方法相比更好的结果 - CVPRADVENT: 基于对抗性熵最小化的语义分割领域自适应
本文提出了两种基于像素预测熵的损失函数的方法来解决语义分割中的无监督域适应问题,分别采用熵损失和对抗性损失。在两个具有挑战性的 “synthetic-2-real” 场景下,我们证明了该方法在语义分割方面具有最先进的性能,并且该方法也可以用 - WarpGAN:自动卡通人物生成
WarpGAN 是一种全自动生成卡通画的神经网络,可以在保留人脸特征的前提下,将图像转换为卡通画。通过引入 identity-preserving adversarial loss 等策略,生成的卡通画视觉效果良好,并且可以自定义不能夸大的 - 泛零样本学习生成对抗网络
本文研究了广义零样学习问题,提出了一种新的模型联合了三种不同的方法:视觉 -> 语义映射,语义 -> 视觉映射和度量学习,并且将它们统一在一个框架内,最终的实验结果表明该模型不仅在分类已知类别的图像上具有较高的准确性,而且在分类未知类别的图 - NIPS具有属性控制的内容保留文本生成
通过该研究,我们提出了一种能够修改文本内容以满足先决条件要求的模型,其通过建立重建和生成关系实现条件兼容和多属性控制。经过定量、定性和人类评估的验证,证明该模型与以往的方法相比,其生成了更加符合先决条件的流畅的句子。
- ICML无监督层次化长期视频预测
本文提出了一种基于神经网络的 Hierarchical Encoder-Decoder 模型,通过对输入帧进行编码,预测高级别的特征,再通过解码器生成预测图像,同时采用了对抗性损失以训练预测器,该方法可以进行 20 秒预测,并在 Human - 通过端到端学习的深度图像压缩
使用深度卷积神经网络的有损图像压缩方法,结合感知损失和对抗损失以及逐渐引入量化误差和速率约束的易到难迁移学习实现更好的速率 - 失真优化。在多个数据集中,相比于 BPG,WebP,JPEG2000 和 JPEG,平均达到了 7.81% - - CVPR人体姿态估计的自对抗训练
本文提出了一种基于深度学习的人体姿势估计方法,采用生成对抗网络作为学习模式,在两个相同结构的堆叠沙漏网络中设定生成器和判别器,生成器用作人体姿势估计,判别器将真实热力图与生成的热力图区分,通过对抗损失反向传播至生成器,使生成器学习合理的人体 - CVPR生成性人脸补全
本文提出一种基于深度生成模型的有效面部完成算法,通过神经网络直接生成缺失区域的内容,并通过重构损失、两种对抗性损失和语义分割损失进行训练,能够处理任意形状的大面积丢失像素并生成逼真的面部完成结果。