Mar, 2022

分层强化学习中的信用分配

TL;DR研究探讨了如何从常规多步强化学习的角度看待分层信用分配,并将其改进为能够提高代理性能的层次算法。