BriefGPT.xyz
Ask
alpha
关键词
masksembles
搜索结果 - 2
如何在近端策略优化中实现不确定性估计
该研究提出了 Actor-Critic RL 算法的不确定性和 OOD 状态的定义,使用多种不确定性估计方法,展示不同的 OOD 检测性能,并提出了一种 Pareto 优化问题的解决方案,应用 Masksembles 方法成功的平衡了奖励和
→
PDF
2 years ago
Masksembles 用于不确定性估计
本文介绍了一种新的深度学习模型 ——Masksembles,它是 Deep Ensembles 和 MC-Dropout 的结合体,通过固定数量的二元掩码,控制模型之间的相关性,以较小的代价实现与 Ensembles 相当的性能。
PDF
4 years ago
Prev
Next