BriefGPT.xyz
大模型
Ask
alpha
关键词
auxiliary learning tasks
搜索结果 - 2
自我预测何时有帮助?理解增强学习中的辅助任务
我们研究了辅助学习任务对强化学习中的表示学习问题的影响,包括观测重建和潜在自预测,并研究它们如何与干扰项和观测函数在 MDP 中交互。
PDF
9 days ago
辅助任务和探索实现 ObjectNav
通过添加辅助学习任务和探索奖励,本文重新启用了一个通用的学习代理,从而实现了对 ObjectNav 挑战的目标导航。分析表明,代理将简化其视觉输入,以平滑其循环神经网络动态,并且辅助任务减少过度拟合。
PDF
3 years ago
Prev
Next