NIPSNov, 2016

学习玩猜猜是谁游戏,并由此发明基于实体的语言

TL;DR采用 Deep Recurrent Q-Networks 框架和基于情境互动的交流为主要驱动力,让多个智能体在 Guess Who? 游戏中进行交互式图像搜索,实现了基于物理概念的单词编码,以及多步骤对话能力的学习。