Mar, 2023

回顾状态:将模拟和真实任务要素融合以实现高效强化学习

TL;DR通过把任务分解成不同的部分并利用动态的不平衡性,使用 “Hindsight States” 方法使得机器人学习更加高效。在多项挑战性仿真测试和一个真正的机器人示例中验证了该方法的有效性。