Apr, 2020

ParaCNN: 基于对抗孪生上下文 CNN 的视觉段落生成

TL;DR本文提出了一种使用纯 CNN 模型生成可包含丰富细节的长段落视觉描述的方法,使用上下文信息的层次 CNN 架构,以及对抗性训练方案,以实现全面建模段落的目的,并在 Stanford 视觉段落数据集上获得了最先进的性能。