AAAIDec, 2023

ReRoGCRL:基于表示的目标条件强化学习中的鲁棒性

TL;DR我们提出了一种新颖的攻击方法和防御机制,分别是半对比表示攻击和对抗性表示策略,用于增强目标导向强化学习算法的对抗鲁棒性。