Nov, 2023

TWIST: 教师 - 学生世界模型蒸馏用于高效的模拟到真实转化

TL;DR使用仿真注入的图像观测作为特权信息,通过教师 - 学生模型蒸馏,本文提出了 TWIST 方法,在基于模型的强化学习任务中实现高效的仿真到实际转移,并在仿真和实际机器人任务中表现出更高的样本效率和任务性能。