BriefGPT.xyz
大模型
Ask
alpha
关键词
robustness measure
搜索结果 - 2
基于遗憾的优化方法用于强化学习的鲁棒性
该论文提出一种更为积极的方法改进深度强化学习中的强健性,采用最小化最大后悔作为优化方法,并证明该方法可显著提高性能。
PDF
a year ago
高斯过程贝叶斯推断的鲁棒性保证
本文探讨了对于 Bayesian 推断模型的输入扰动的鲁棒性估计问题,通过使用高斯过程理论并提出算法计算当前模型在输入空间中的紧密强度,并应用于两个例子中:一个 GP 回归问题和一个全连接深度神经网络来研究 MNIST 数据集上的对抗性例子
→
PDF
6 years ago
Prev
Next