BriefGPT.xyz
Ask
alpha
关键词
carl
搜索结果 - 2
ICML
安全关键环境下的强化学习谨慎自适应
提出一种安全关键的适应性强化学习任务设置和解决方案 CARL,通过以多样化环境中的先前经验来评估风险,实现对新领域的谨慎探索并避免灾难状态,为城市驾驶等安全关键环境下的强化学习提供可行性。
PDF
4 years ago
安全玩法:具备放弃选项的对抗性鲁棒性
本文探讨了一种适用于分类器在对抗样本上放弃输出任何类别 (即通过放弃输出任何类别来实现对抗鲁棒性) 的情况下的对抗鲁棒性问题,提出了一种新的带有放弃选项的对抗鲁棒性目标函数,并提出了一个基于该目标函数的基准,最后提出了一种 Combined
→
PDF
5 years ago
Prev
Next