Nov, 2023

实时策略游戏中的奖励塑造以提高学习能力

TL;DR我们研究了奖励塑型在实时策略的夺旗游戏中提高强化学习性能的效果,并证明适当设计的奖励塑型函数能显著提高玩家的性能和训练时间。