Sep, 2023

提高强化学习中的数据效率:基于网格信息传播的新想象力机制

TL;DR通过引入想象力机制,提高强化学习算法的数据效率,并在四个主流算法(SAC、PPO、DDPG 和 DQN)中得到了相对较好的性能提升。