Dec, 2023

强化学习的遗忘

TL;DR提出了两种强化学习取消学习方法:逐渐减少强化学习和环境污染攻击。为了解决强化取消学习的挑战,引入了“环境推断攻击”的概念来评估取消学习结果。