Jun, 2023

稳定对比强化学习:离线目标达成技术

TL;DR通过对比强化学习问题的先前对比方法,我们发现,结合谨慎的权重初始化和数据增强,使用浅而宽的架构可以显著提高这些对比强化学习方法在挑战性的模拟基准测试中的性能,并且可以通过这些设计决策解决实际的机器人操作任务。