BriefGPT.xyz
Dec, 2020
神经动态策略的端到端感觉-运动学习
Neural Dynamic Policies for End-to-End Sensorimotor Learning
HTML
PDF
Shikhar Bahl, Mustafa Mukadam, Abhinav Gupta, Deepak Pathak
TL;DR
该论文提出了一种新的策略表示——神经动力学策略,通过将动力学系统嵌入到神经网络策略中,通过二阶微分方程来重新参数化动作空间以实现端到端的政策学习,并在几个机器人控制任务中展示了神经动态策略比传统的基于先验的策略学习方法更高的效率和性能表现。
Abstract
The current dominant paradigm in
sensorimotor control
, whether imitation or
reinforcement learning
, is to train policies directly in raw action spaces such as torque, joint angle, or end-effector position. This f
→