Aug, 2022

用度量残差网络进行高样本效率的目标条件强化学习

TL;DR本文介绍了一种基于 Metric Residual Network (MRN) 的神经架构来实现物理机器人中的效率更高的 goal-conditioned reinforcement learning (GCRL),在 12 个标准基准环境中进行了全面的实验,证明了其在样本效率方面的显着优越性。