Dec, 2020

神经动态策略的端到端感觉-运动学习

TL;DR该论文提出了一种新的策略表示——神经动力学策略,通过将动力学系统嵌入到神经网络策略中,通过二阶微分方程来重新参数化动作空间以实现端到端的政策学习,并在几个机器人控制任务中展示了神经动态策略比传统的基于先验的策略学习方法更高的效率和性能表现。