Sep, 2023

通过强化学习来设计人群模拟的奖励函数

TL;DR通过在虚拟世界中以人类般的方式导航的自主角色,群集模拟对于游戏设计非常重要。本文探索了基于强化学习的群集模拟的奖励函数设计,并根据其分析性质理论上阐明了特定奖励函数的有效性,并通过以能源效率为度量标准的一系列场景进行实证评估。实验结果表明,通过在适当缩放的引导潜能的基础上直接最小化能源消耗是一种可行的策略,这使得我们能够研究不同奖励组成对模拟群体行为的影响。我们的研究成果可为新的群集模拟技术开发提供参考,并对人类般导航的深入研究有所贡献。