Feb, 2023

零样本 Sim2Real 环境自适应

TL;DR提出了使用 Reverse Action Transformation(RAT)策略的方法来解决模拟到现实世界之间的转换问题,并且和其他基线模型相比,在连续控制任务中可实现零样本适应。