- 单个物体位姿跟踪的反假粒子滤波器
本文提出一种基于 Counter-Hypothetical 似然函数的方法来解决 6D 姿态估计中粒子缺失和模式崩溃的问题,并在刚性物体 6D 姿态跟踪任务上验证了其有效性。
- CVPR通过图像特定提示学习进行零样本生成模型适应
该研究项目提出了一种名为图像特定提示学习(IPL)的方法,能够为每个源域图像学习特定的提示向量,从而为每个跨域图像对提供更准确的适应方向,增强目标域生成器的灵活性,并改善合成图像的质量和多样性。
- 对抗生成网络中防止模式崩溃的分布拟合
本文提出了一种全局分布拟合方法和一种局部分布拟合方法来解决生成式对抗网络中的模式崩溃问题,实验证明这两种方法具有有效性和竞争性表现。
- 生成模型中的公平性
本文为了解决生成模型中的公平性问题和模式崩溃,设计了以无监督方式为基础,假设我们没有关于敏感变量的先验知识的算法,以尽可能多的敏感变量包括我们可能不知道的变量为前提,改善公平性的方法。图片中的人脸(甚至是生成的人脸)已被删除以减少法律风险。
- 信息最大化准则的自监督学习
本文介绍一种基于互信息的 self-supervised 方法 CorInfoMax,该方法通过最大化高斯混合分布下的互信息解决了 mode collapse 和 dimensional collapse 问题。
- AAAI通过流形熵估计来抑制 GAN 中的模式崩溃
本文提出了一种新的训练管道以解决生成对抗网络(GAN)中的模式崩溃问题,通过将鉴别器推广为特征嵌入并最大化鉴别器学习到的嵌入空间的分布熵,利用两个正则化项:Deep Local Linear Embedding 和 Deep Isometr - Wasserstein 条件生成对抗神经网络的稳定并行训练
提出了稳定且并行的方法,用固定的计算资源训练 Wasserstein 条件 GAN,通过使用多个生成器并避免进程间通信来减少模式塌陷的风险和提高可扩展性。在 CIFAR10,CIFAR100 和 ImageNet1k 数据集上验证了该方法的 - MULTI-FLGANs:用于非独立同分布的多分布式对抗网络
提出了一种名为 MULTI-FLGAN 的新型体系结构,旨在解决非独立同分布数据集的 GAN 稳定性问题、低质量图像及模式崩溃问题,并在 20 个客户端上与基线 FLGAN 相比,稳定性和性能均提升了四倍。
- 利用自适应多对抗训练克服模式崩溃
本研究以新的数据生成过程为基础,揭示了生成对抗网络(GAN)生成器模式崩溃的驱动因素是判别器对先前样本的分类准确性的遗忘,即连续学习中的灾难性遗忘现象。为了解决此问题,我们引入了一种自适应生成额外判别模式的训练方法,可以减轻模式崩溃并提高 - MMGAN 内部模式崩溃的黑盒诊断和校准:一项试点研究
本文探讨了生成对抗网络(GANs)中的模式崩溃问题,提出了一种基于采样的统计工具来诊断和校准 GANs 中的内部模式崩溃。研究表明,这种状态仍然很普遍,并且在黑匣子设置中可以诊断和校准。
- CVPR双重对比学习用于无监督图像翻译
本文提出了一种新的基于对比学习与双学习设置的方法,用于有效地推断未匹配数据之间的映射,同时解决了 “切割” 方法存在的潜在问题,并通过大量的消融研究和多个挑战性的图像翻译任务展示了优越的性能。然后,我们证明了非监督方法和监督方法之间的差距可 - CVPR基于划分指导的生成对抗网络
该论文提出一种基于分区器的生成对抗网络的无监督学习方法,通过将高维空间分解为一组简单的子空间,训练每个子空间对应的生成器,以避免模式崩溃和样本集断裂等训练问题,理论和实验表明,该方法在各种标准基准测试中表现优于其他近期的方法。
- 使用黑塞矩阵特征值的实证分析抗击 GAN 训练中的模式坍塌
通过分析损失面的 Hessian 特征值,我们设计了一种新的优化算法 nudged-Adam (NuGAN),利用谱信息来克服 mode collapse,导致经验上更稳定的收敛性能。
- ICML一种收敛且与维度无关的极小 - 极大优化算法
研究了一种新型的 min-max 优化框架,其中 max-player 在贪心策略下更新参数至一阶稳定点;给出了在平稳性要求下的定理证明,提出了一种利用随机梯度估计的 GAN 训练算法,成功地避免了模式崩溃的问题。
- CVPR自我条件 GAN 的多样性图像生成
提出了一种简单而有效的无监督方法,通过使用聚类方法自动地生成类别标签,来训练条件生成对抗网络模型(GAN 模型)生成多样而逼真的图像,这种方法在处理模式崩溃方面表现优异,同时在 ImageNet 和 Places365 等大规模数据集上产生 - GMM-UNIT: 基于属性高斯混合模型的无监督多领域多模态图像转换
GMM-UNIT 基于分离内容 - 属性表示的方法,其中属性空间拟合了高斯混合模型,每个高斯混合模型组件代表一个域,它具有可以轻松扩展到大多数多域和多模态图像的优势,同时具有连续域编码,可以在域之间进行插值和外推,是用于无监督图像到图像翻译 - Meta-CoTGAN:一种元合作训练方法提升对抗性文本生成
本文提出一种新的方法,通过引入协作训练和元学习机制,有效地减缓了对抗性生成网络中的模式崩溃,实现了在生成质量和多样性方面显著胜过基线方法的结果。
- ICLR使用比较歧视的自对抗学习进行文本生成
提出了一种新的自我对抗学习(SAL)范式,通过使用相对鉴别器作为 GAN 的鉴别器,并引入自我改进奖励机制,成功地解决了 GAN 在生成文本方面的奖励稀疏性和模式崩溃问题,并在文本生成基准数据集上取得了更高质量和更稳定的性能表现。
- AE-OT-GAN: 从数据特定的潜在分布训练 GAN
本文提出 AE-OT-GAN 模型,借鉴 AE-OT 模型解决了 GAN 模型生成的图片模式坍塌 / 混合问题,同时生成高质量图像;最终通过潜在分布转换映射生成连续的数据分布。实验证明本文方法在简单的 MNIST 数据集和复杂的数据集(如 - CVPRGAN 中梯度爆炸的缓解:假的可以成为真的
提出了一种新的生成对抗网络训练方法 Fake-As-Real GAN(FARGAN),该方法通过将某些虚假样本在训练过程中视为真实样本,从而减少生成器在梯度爆炸区域接收的梯度值,理论上证明了梯度爆炸可以通过对真假样本的区分来减轻,实验证明该