Feb, 2024

视频游戏实现的无仿真器视觉领域随机化

TL;DRBehAVE 是一个视频理解框架,通过利用多样性的商用视频游戏作为领域随机化的来源,使用玩家行为来指导视频的对齐,从而实现基于一个第一人称射击 (FPS) 游戏的训练,在多个未见过的 FPS 游戏中成功传递玩家行为模式的零样本转移,并且在训练于不同类型游戏(如 Minecraft)的情况下,提高了基础模型到未见过的 FPS 游戏的零样本转移能力(最多达 22%)。