Aug, 2019

利用地图熟悉、课程学习和赌徒反馈学习基于文本冒险游戏的系列

TL;DR本研究探讨了如何应用深度强化学习策略来让计算机代理学会玩一类由文本组成的冒险游戏,并使用基于人类学习行为的简单策略如课程学习、导航探索和多臂赌博来提高游戏的任务完成率。