Mar, 2025
CombatVLA:用于3D动作角色扮演游戏中战斗任务的高效视觉-语言-行动模型
CombatVLA: An Efficient Vision-Language-Action Model for Combat Tasks in
3D Action Role-Playing Games
TL;DR本研究针对当前视觉-语言-行动模型在复杂3D环境中实时决策的不足,提出了一种专为3D动作角色扮演游戏战斗任务优化的高效模型CombatVLA。研究表明,CombatVLA在战斗理解基准上超越了现有所有模型,并在游戏战斗中实现了50倍的加速,同时任务成功率高于人类玩家。