Sep, 2015

循环强化学习:一种混合方法

TL;DR本文研究了一种深度学习方法,将强化学习和监督学习结合,通过长短时记忆网络对隐藏状态的表示进行学习,在部分可观测任务中表现出了很好的性能。