BriefGPT.xyz
Ask
alpha
关键词
reset mechanism
搜索结果 - 1
ICML
深度强化学习中的优先偏差
本文研究了深度强化学习算法中的优先性偏差问题,提出了一种简单且通用的机制来解决这个问题,并将其应用于离散和连续动作领域的算法中,从而显著提高了它们的性能。
PDF
2 years ago
Prev
Next