Mar, 2017

目标驱动和视觉对话系统的全流程优化

TL;DR本文介绍了一种基于深度强化学习的方法,使用策略梯度算法来优化基于任务且与视觉相关的对话,该方法在通过 Mechanical Turk 收集的 12 万个对话数据集上进行了测试,并提供了鼓舞人心的结果,可以解决生成自然对话和在复杂图像中发现特定对象的问题。