BriefGPT.xyz
Ask
alpha
关键词
parameter uncertainties
搜索结果 - 2
通过生成模型实现鲁棒强化学习的样本复杂性
该研究提出了一种基于模型的强化学习算法,用于学习在标准和不确定的模型下最优的稳健控制策略,并考虑了不同形式的不确定性集合
PDF
3 years ago
具有对抗攻击的强化学习做法
本文提出了针对强化学习的对抗攻击,并通过这些攻击提高了深度强化学习算法对参数不确定性的鲁棒性。我们展示了即使是一个简单的攻击也能成功降低深度强化学习算法的性能,并进一步使用工程丢失函数的梯度信息改进了攻击方法,导致性能进一步降低。这些攻击方
→
PDF
7 years ago
Prev
Next