BriefGPT.xyz
Ask
alpha
关键词
risk-sensitive learning
搜索结果 - 2
MM
风险敏感学习的学习界限
本文提出了对通过优化确定性等价描述的具有不同风险表示的风险敏感学习方案的概括性质进行研究的方法,提供了针对经验 OCE 最小化器的两个学习边界,并通过神经网络实验演示了所提边界的实际意义。
PDF
4 years ago
DSAC: 基于分布式的软演员 - 评论家算法用于风险敏感强化学习
DSAC 是一种新的强化学习算法,它通过利用积累奖励的分布信息来获得更好的性能。通过将 SAC 与基本分布式目标观点无缝集成, DSAC 考虑了行动和回报中的随机性,并在几个连续控制基准测试中超越了现有技术基线。除此之外,我们还探讨了三个具
→
PDF
4 years ago
Prev
Next