ICMLJun, 2021

SECANT: 自学习克隆以实现视觉策略的零样式泛化

TL;DR本论文提出了一种名为 SECANT 的新型自我专家复制技术,旨在学习从弱增强到强增强的映像数据,以提高其对视觉变化的鲁棒性,在包括 DeepMind Control,机器人操作,基于视觉的自主驾驶和室内物体导航在内的四个具有挑战性的领域,SECANT 显着提高了 SOTA 的平均奖励。