BriefGPT.xyz
Ask
alpha
关键词
std q-target
搜索结果 - 1
SQT - std Q-target
Std Q-target 是一种保守的,基于单一关键的 Q 公式:Q 网络标准差,在强化学习中解决过高估计的偏见问题,我们将 SQT 应用于 TD3/TD7 代码并在七种常见的 MuJoCo 和 Bullet 任务上与最先进的 actor-
→
PDF
5 months ago
Prev
Next