从单张图像和视频中学习生成新颖场景构图

CVPRMay, 2021

从单张图像和视频中学习生成新颖场景构图

Learning to Generate Novel Scene Compositions from Single Images and Videos

Vadim Sushko, Juergen Gall, Anna Khoreva

TL;DR本文提出了一种称为 One-Shot GAN 的算法，可从仅有一张图像或短视频的训练集中进行学习，利用两个判别器实现对内部内容和场景布局真实性的分开评估，并在保留原始样本内容的基础上构造出视觉上逼真、新颖的场景组合合成，相较于之前的单图像 GAN 模型具有更高的多样性和合成质量，同时也能够在单个视频场景中有效学习。

Abstract

Training gans in low-data regimes remains a challenge, as overfitting often leads to memorization or training divergence. In this work, we introduce →

gans low-data regimes one-shot gan discriminator composition synthesis

发现论文，激发创造

更多尽于少：低数据情境下高效细粒度视觉识别

通过利用增强和蒸馏技术，AD-Net 框架通过自我蒸馏技术在增强样本上优化学习特征，减轻有害的过拟合，从而在弱数据条件下提高深度神经网络性能，相对于标准 ResNet-50 和最先进的低数据技术的 SOTA 接近者，我们的框架相对准确度最高可达到 45％和 27％，我们强调我们的方法在体系结构上是独立的，并且在推理时间上不增加任何额外成本。

Jun, 2024

基于 Transformer 的时间序列合成综述

在图像和语言领域，生成式人工智能已经引起了很大关注，使用转换器神经网络持续主导最新技术。然而，将这些模型应用于时间序列生成的研究尚不充分，而这对于机器学习、隐私保护和可解释性研究具有极大的实用价值。本综述通过识别转换器、生成式人工智能和时间序列数据这一稀缺研究子领域，回顾了已有的研究工作。回顾的工作方法多样，但尚未就该领域提出解决问题的确定答案。在最初进行的调查中，除了转换器之外，还遇到了 GANs、扩散模型、状态空间模型和自编码器。虽然该领域还没有提供确定性的洞见，但是已经回顾的工作具有很大的启发性，并提供了一些建议的最佳实践和有价值的未来工作建议。

Jun, 2024

无需训练数据集的条件生成对抗网络

给定一个无限制的预训练生成网络和一个预训练分类器，通过不依赖于任何训练数据集，开发一个条件生成器是否可行？

May, 2024

可视化和绘制 GAN 激活

我们研究了 GAN 生成的结构与它们在隐藏层中的激活之间的相关性，目的是更好地理解这些模型的内在机制，并能够使用无条件训练的 GAN 绘制结构。这使我们能够更好地控制生成的图像，可以根据语义分割图生成它们，而不需要在训练数据中包含该分割。为此，我们引入了可平铺特征的概念，使我们能够识别适用于绘画的激活。

May, 2024

利用 GAN 增强医学图像从有限数据中合成逼真图像

通过引入生成对抗网络（GANs）的创新方法，我们提出了一种合成医学图像的方法，通过深度卷积神经网络（CNNs）架构的生成器和鉴别器网络以及对抗训练方法，即使在有限的真实医学图像数据训练下，也能生成逼真的合成图像，并成功模拟了真实医学图像的结构和纹理特征。

May, 2024

无监督预训练的语言 - 视觉提示用于低数据实例分割

在当前的研究中，根据最新的 DETR（DEtection TRansformer）范式，基于查询的端到端实例分割（QEIS）方法在大规模数据集上训练时表现出了卓越的性能，尤其是与基于 CNN 的模型相比。然而，当面对有限的训练数据时，这些 QEIS 方法的有效性显著降低。为解决这一问题，我们提出了一种新颖的方法，用于无监督预训练在低数据环境中，即 Unsupervised Pre-training with Language-Vision Prompts (UPLVP)，通过将语言 - 视觉提示引入查询 / 核心，改善了 QEIS 模型的实例分割。我们的方法包括三个部分：(1) Mask Proposal：利用语言 - 视觉模型基于无标签图像生成伪掩膜。(2) Prompt-Kernel Matching：将伪掩膜转换为提示，并将最佳匹配的定位和形状特征注入到对应的核心中。(3) Kernel Supervision：以核心级别制定预训练的监督，以确保鲁棒学习。在我们的预训练方法的帮助下，QEIS 模型可以在低数据环境中更快地收敛并表现出更好的性能，实验评估表明，当使用我们的方法进行预训练时，QEIS 模型在 MS COCO、Cityscapes 和 CTW1500 数据集上的表现可以显著提高。代码将在此 https URL 中提供。

May, 2024

利用 LSTM 和 GAN 进行现代恶意软件检测

该研究使用深度学习模型、LSTM 网络和 GAN 来提高恶意软件检测的准确性和速度，通过 VirusShare 数据集的训练和评估，表明深度学习在主动网络安全防御中发挥着决定性的作用。此外，研究还探讨了集成学习和模型融合方法对减少偏差和提高模型复杂性的影响。

May, 2024

CharacterFactory: GANs 采样一致性字符用于扩散模型

在这项工作中，我们提出了 CharacterFactory，这是一个允许在 GAN 的潜在空间中采样具有一致身份的新字符的框架，并且设计了一个上下文一致性损失函数来确保生成的身份嵌入在不同上下文中能产生一致身份的图像。

Apr, 2024

多视图子图神经网络：稀缺标记数据的自监督学习

利用子图构建长距离依赖关系来改善低数据环境下节点分类的性能，并提出了一种名为 Muse 的自监督学习框架，通过联合捕获局部结构和长距离依赖关系，提高了图中节点的表示表达能力。

Apr, 2024

基于参考的三元面 3D 感知图像编辑

通过对 EG3D 的三平面空间的探索和演示，本研究提供了一个集成框架，用于实现高质量的基于参考的三维感知图像编辑，并通过创新的流程在三维感知图像编辑方面呈现出独特的视角。

Apr, 2024