Jan, 2024

一个高效的通用化视觉动作策略框架:基于控制感知增强和特权引导蒸馏

TL;DR通过数据增强来解决在学习高维视觉观察中适应新环境及复杂视觉变化所面临的泛化问题,提出了学习控制感知掩码的方法以及通过预先训练的强化学习专家将知识传输给学生视觉动作策略来解决训练不稳定性问题。