May, 2024

自我先见力:智能体视觉动作预测作为强化学习的规范化方法

TL;DR以运动预测为基础的自我监督方法 Ego-Foresight 可提高强化学习算法的效果和性能。