Mar, 2023

通过奖励塑造将上下文信息嵌入多智体学习中:以Google足球为例的案例研究

TL;DR本研究旨在通过奖励塑形方法来解决多智能体环境下MARL算法以及稀疏奖励信号产生的挑战,在Google Research Football环境中实验结果表明,奖励塑形方法对于训练多智能体环境下的RL算法是有用的。