Jan, 2024

M2CURL: 机器人操作的自主监督表征学习实现高效的多模态强化学习

TL;DR提出了一种名为M2CURL的多模态对比无监督强化学习方法,该方法可以有效整合不同的观察模态,通过学习高效的表征进而提高强化学习算法的稳健性和样本效率。该方法在触觉模拟环境中得到了验证,相较于标准的强化学习算法,其学习效率显著提高,表现为更快的收敛速度和更高的累积奖励。