BriefGPT.xyz
大模型
Ask
alpha
关键词
continuous and discrete action spaces
搜索结果 - 1
使用 Q 网络表示的转移强化学习在不同操作空间中的应用
本研究旨在探究在不同动作空间领域之间进行知识传递的可能性和有效性,提出了一种基于源嵌入相似性的奖励塑形方法,可适用于具有离散和连续动作空间的领域。在 Acrobot-v1 和 Pendulum-v0 领域上,基于两个基线的比较表明我们的方法
→
PDF
2 years ago
Prev
Next