NIPSOct, 2016

学习何时何地绘制

TL;DRGenerative Adversarial Networks 已经在绘制逼真的世界图片方面展现了相当可观的能力,现有的模型可以根据类别标签或标题等全局限制生成图像,但不能控制姿势或对象位置,本文提出了一种新的模型 ——Generative Adversarial What-Where Network,它能根据所描述的内容和位置进行图像综合,并在 Caltech-UCSD Birds 数据集上展示了高质量的 128 x 128 图片综合,还可以控制鸟周围的边界框及其组成部分,通过模拟条件分布,我们的系统还能够使各个部分进行控制,同时展示了在 MPII Human Pose 数据集的关于人体动作图像的文本与位置可控合成的初步结果。