BriefGPT.xyz
Ask
alpha
关键词
sota rl models
搜索结果 - 1
提高强化学习中的数据效率:基于网格信息传播的新想象力机制
通过引入想象力机制,提高强化学习算法的数据效率,并在四个主流算法(SAC、PPO、DDPG 和 DQN)中得到了相对较好的性能提升。
PDF
9 months ago
Prev
Next