Nov, 2023

目视与思考:虚拟环境中的具身智能体

TL;DRSTEVE 是一个在 Minecraft 虚拟环境中基于大型语言模型的综合和具有远见的具象代理,其三个关键组成部分是视觉感知、语言指导和代码动作,通过视觉信息解释、迭代推理和可执行技能行为生成,STEVE 在 Minecraft 环境中实现更快的技能解锁和方块搜索任务。