May, 2023

通过自主神经动态策略实现端到端稳定的模仿学习

TL;DR本文介绍了一种基于自主动力学系统的 Autonomous Neural Dynamic Policies(ANDPs),其优点在于比传统的稳定动力学系统策略更加灵活。实验结果表明 ANDPs 在几种模仿学习任务中表现出出色的灵活性和能力。