BriefGPT.xyz
大模型
Ask
alpha
关键词
latent self-prediction
搜索结果 - 1
自我预测何时有帮助?理解增强学习中的辅助任务
我们研究了辅助学习任务对强化学习中的表示学习问题的影响,包括观测重建和潜在自预测,并研究它们如何与干扰项和观测函数在 MDP 中交互。
PDF
9 days ago
Prev
Next