NIPSNov, 2013

探索深度和循环结构用于最优控制

TL;DR本文研究了多层神经网络在控制方面的应用,特别是在连续高维动作任务中,通过强化学习训练后实现了控制策略,结果表明可以成功训练具有成千上万个参数的神经网络控制器,并比较了各种不同结构。文章讨论了这一问题与以往有监督知觉任务的区别,呈现了实验结果,并讨论了将深度学习技术应用于控制问题优化的未来方向。