ICMLJul, 2021

RRL:ResNet 用于强化学习的表示

TL;DR我们提出了 RRL(使用 Resnet 作为 Reinforcement Learning 的表示)作为一种简单而有效的方法,可以直接从固有输入中学习复杂的行为,其在高维领域中的学习性能和样本效率甚至可以与直接从状态中学习相匹配,尤其在模拟的机器人灵巧操作基准中表现出接触丰富的行为。