BriefGPT.xyz
Ask
alpha
关键词
distributional soft actor critic
搜索结果 - 1
DSAC: 基于分布式的软演员 - 评论家算法用于风险敏感强化学习
DSAC 是一种新的强化学习算法,它通过利用积累奖励的分布信息来获得更好的性能。通过将 SAC 与基本分布式目标观点无缝集成, DSAC 考虑了行动和回报中的随机性,并在几个连续控制基准测试中超越了现有技术基线。除此之外,我们还探讨了三个具
→
PDF
4 years ago
Prev
Next