Mar, 2017
目标驱动和视觉对话系统的全流程优化
End-to-end optimization of goal-driven and visually grounded dialogue systems
Florian Strub, Harm de Vries, Jeremie Mary, Bilal Piot, Aaron Courville...
TL;DR本文介绍了一种基于深度强化学习的方法,使用策略梯度算法来优化基于任务且与视觉相关的对话,该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试,并提供了鼓舞人心的结果,可以解决生成自然对话和在复杂图像中发现特定对象的问题。