关键词open-world environments
搜索结果 - 2
- 开放词汇 SAM3D:理解任何三维场景
OV-SAM3D 是一个通用框架,用于不需要训练即可理解任何 3D 场景的开放词汇三维场景理解,通过使用 Segment Anything Model (SAM) 生成超点并通过 Recognize Anything Model (RAM) - GROOT: 通过观看游戏视频学习遵循指令
通过引入视频作为指导说明,我们研究了在开放世界环境中构建能够跟随无限指令的控制器的问题,并提出了一种全新的学习框架,该框架能够从游戏视频中学习这种跟随指令的控制器,并生成一个诱导结构化目标空间的视频指令编码器。通过对提出的 Minecraf