ICLRJun, 2021

利用内部分布触发器中毒深度强化学习代理

TL;DR本文提出了一种新的数据毒化攻击,并将其应用于深度强化学习代理程序。我们的攻击聚焦于所谓的分布触发器,这些触发器是该模型将在其中接受训练和部署的数据分布的本地触发器。我们概述了一种简单的过程,用于嵌入这些及其他触发器在多任务深度强化学习代理中,并在三个常见的强化学习环境中进行了演示。我们认为这项工作对于深度学习模型的安全性具有重要意义。