BriefGPT.xyz
Ask
alpha
关键词
capacity loss
搜索结果 - 1
ICLR
理解和防止增强学习中的能力损失
本文研究深度强化学习中的一种现象 —— 容量丧失,提出 Initial Feature Regularization(InFeR)算法,该算法可以有效缓解容量丧失并显著提高稀疏奖励任务中的性能表现。
PDF
2 years ago
Prev
Next