Jun, 2017

将判别学习中的知识转移至生成式视觉对话模型的最佳方法

TL;DR本文提出一种新的训练神经序列模型,将判别式对话模型的知识传递到生成式对话模型中,通过 Gumbel-Softmax 逼近离散分布,建立了一个可端对端训练的生成式视觉对话模型,并在视觉对话数据集上显著优于现有模型 (10 个问题中有 2.67 个问题得分有所提高)。