BriefGPT.xyz
Ask
alpha
关键词
adaptive adversarial perturbation
搜索结果 - 1
应用动作空间中自适应对抗扰动的鲁棒深度强化学习
深度强化学习算法中的模拟和真实世界之间的建模错误问题,通过使用对抗学习生成扰动以建模差异并提高深度强化学习的鲁棒性,在控制对抗性扰动的参数上存在平均性能和鲁棒性之间的权衡。为了保持训练的稳定性并提高鲁棒性,我们提出了一种简单而有效的方法,即
→
PDF
2 months ago
Prev
Next