May, 2024

隐蔽仿真: 奖励引导的环境无关策略窃取

TL;DR这篇论文介绍了一种名为 Stealthy Imitation 的攻击方法,旨在不接触环境或者获知输入范围的情况下窃取深度强化学习策略,并提出了一种降低攻击效果的对策。