Oct, 2023

DrM:通过最小化休眠比率实现视觉强化学习的控制

TL;DR通过减少网络的休眠比率,提高样本效率和渐进性能的可视化强化学习方法。