Jan, 2024

VizDoom 中的行为克隆

TL;DR通过只使用像素数据作为输入,本研究论文描述了训练自主智能体在游戏《毁灭战士 2》中通过模仿学习(IL)进行游戏的方法。我们还探讨了强化学习(RL)相对于 IL 在摄像机运动和轨迹数据方面的人类性,并通过行为克隆(behavioural cloning)研究了个体模型学习不同行为特征的能力。我们尝试模仿具有不同游戏风格的真实玩家的行为,发现我们可以训练出具有攻击性、被动性或比传统 AI 更接近人类的行为的智能体。我们提出了这些在视频游戏中引入更多深度和接近人类行为的方法。经过训练的 IL 智能体在我们的数据集中的表现与普通玩家相当,同时优于最差的玩家。尽管性能没有常见的 RL 方法强,但它为智能体提供了更强的接近人类行为特征。