Sep, 2017

深度 TAMER:高维状态空间中的交互式智能体塑形

TL;DR本论文提出了 Deep TAMER,这是 TAMER 框架的扩展,利用深度神经网络的表征能力快速学习复杂任务,通过仅仅 15 分钟的人类反馈训练出比人类更优秀的 Atart 游戏 “保龄球” 的自主学习代理。