May, 2024

PEAC:无监督预训练跨体现感知强化学习

TL;DR通过无监督学习以及预先训练的方式,提出了一种适用于不同体现形式的强化学习的控制策略,能够显著提高适应性能和跨体现形式的泛化能力。