NIPSNov, 2016
学习玩猜猜是谁游戏,并由此发明基于实体的语言
Learning to Play Guess Who? and Inventing a Grounded Language as a Consequence
Emilio Jorge, Mikael Kågebäck, Fredrik D. Johansson, Emil Gustavsson
TL;DR采用 Deep Recurrent Q-Networks 框架和基于情境互动的交流为主要驱动力,让多个智能体在 Guess Who? 游戏中进行交互式图像搜索,实现了基于物理概念的单词编码,以及多步骤对话能力的学习。