BriefGPT.xyz
大模型
Ask
alpha
关键词
learning state representations
搜索结果 - 1
比较强化学习表征学习的辅助任务
生成表示在强化学习中得到了稳步流行,由于其在提高样本效率和许多环境中的回报方面的潜力。本文对常见的辅助任务进行了比较,基于数百个使用最先进的离策略强化学习算法训练的代理程序。发现显示,辅助任务的表示学习对于维度和复杂度较高的环境是有利的,并
→
PDF
9 months ago
Prev
Next