BriefGPT.xyz
Ask
alpha
关键词
expert observations
搜索结果 - 2
基于模型的方法提高强化学习效率:借助专家观察
该研究通过采用专家观察(不涉及具体专家行为信息)来改进深度强化学习模型的样本效率,并通过提出一种自动调整增强损失函数中各组成部分权重的算法,证明了该算法在多种连续控制任务中通过有效利用可用的专家观察优于其他基准模型。
PDF
4 months ago
从像素学习与专家观察
使用专家观察作为强化学习智能体的中间视觉目标,可以帮助解决稀疏奖励问题,从而提高性能并减少专家动作的使用。
PDF
a year ago
Prev
Next