Sep, 2017

OptLayer - 实用的深度强化学习受限优化技术在实际应用中的研究

TL;DR提出了一种新的强化学习架构 OptLayer,该架构保证机器人执行的所有行为都是安全的,使得机器人的深度强化学习应用范围从模拟世界扩大到实际世界,并应用于机器人的伸手任务中。