半参数图像合成
提出了一种基于记忆驱动的半参数方法来进行文本生成图像,这种方法基于参数和非参数技术,其中非参数部分是图像特征的记忆库,而参数化部分是生成敌对网络。实验结果表明,所提出的记忆驱动半参数方法在视觉保真度和文本图像语义一致性方面比纯参数方法产生更逼真的图像。
Aug, 2022
提出利用语义布局来综合生成逼真图像的新方法,该方法建立了区域之间的依赖关系并通过动态加权网络实现,既保留了语义区分,同时加强了语义相关性,提高了全局结构和细节的合成质量。
Sep, 2021
通过使用自适应规范化层来调整激活函数,我们提出了一种简单但有效的方法来合成具有输入语义布局的逼真图像,这种方法可以提高视觉保真度和与输入布局的对齐度,并允许用户控制语义和风格。
Mar, 2019
本研究提出了一种半监督语义分割的新方法,采用对比学习模块,通过维护持续更新的内存库,将具有相同类别的样本的像素级特征表示相似,通过端到端的训练,优化标注和未标注数据的特征,能够在公共基准测试中取得比半监督语义分割和半监督领域适应的现有技术更好的表现,尤其在标注数据较少的情况下有更大的提升。
Apr, 2021
本文提出一种新的基于语义布局的文本到图像的分层方法,通过语义布局生成器和图像生成器将生成过程分解为多个步骤完成,能够提高图像质量和与输入文本的语义对齐性。
Jan, 2018
我们提出了一种新的无标签条件的扩散模型,通过神经语意图像合成从预训练基础模型提取的神经布局作为条件来实现细粒度的空间控制,实验结果表明,通过神经语意图像合成合成的图片在语义分类、实例分离和物体方向上比较传统的无标签条件选项更具优势,同时,我们还展示了通过神经布局条件生成的图片能够有效地用于训练各种感知任务。
Jul, 2024
本文提出了一种使用自然语言描述直接合成逼真图像的方法,它有很多有用的应用,例如智能图像操作。我们提出了一种端到端的神经架构,利用对抗学习自动学习隐式损失函数,实现语义分离并生成新图像。通过在 Caltech-200 鸟类数据集和 Oxford-102 花卉数据集上进行实验,我们证明了我们的模型能够合成符合描述要求的逼真图像,同时仍保留原始图像的其他特征。
Jul, 2017
本文提出了一种半监督深度学习架构,扩展了面部素描合成以处理现实中的面部照片,该方法使用小的参考照片集中的照片与输入照片进行补丁匹配,并使用相应的素描特征补丁组成伪素描特征表示来监督网络。通过该方法,我们可以使用参考照片集和大型面部照片数据集对网络进行训练,并取得公共基准测试和野外面部照片方面最先进的表现。
Dec, 2018
本文提出了一种从语义类分布的角度来支持语义或实例级别多样性生成的多样语义图像合成框架,包括条件调制参数和噪声重映射,并在多个数据集上取得了良好的效果。
Mar, 2021