Nov, 2022

基于奖励的可配置智能体:游戏风格连续体生成

TL;DR本文提出了一种利用强化学习算法设计视频游戏测试的方法 --CARI 代理,相比于传统的基于奖励函数规划的算法,CARI 能更好地模拟多样的游戏风格,并能够通过单次训练达到传统方法的多倍效果,该新型代理可以用于游戏行为及平衡性调整等方面的研究。