Jun, 2024

OmniJARVIS: 统一的视觉 - 语言 - 行为标记使得开放世界指导跟随代理

TL;DROmniJARVIS 是一个新颖的视觉 - 语言 - 动作(VLA)模型,用于开放世界 Minecraft 中的指令跟随代理。通过对多模态交互数据进行统一分词,OmniJARVIS 能够具备强大的推理和高效的决策能力,并在开放世界 Minecraft 中的多种任务上表现出优异的性能。