Apr, 2017

自然语言引导的强化学习在 Atari 游戏中的探索

TL;DR该研究介绍了第一个深度强化学习代理,利用自然语言指令学习打败 Ataria 游戏。代理人利用环境观察和自然语言之间的多模态嵌入来自我监控进度,并通过完成自然语言指令来获得奖励。该代理人在 Montezuma's Revenge 环境上显著优于其他代理人。