BriefGPT.xyz
Ask
alpha
关键词
cross-modality imitation learning
搜索结果 - 1
通过并行的文本世界训练的具有多模态的体验智能体
我们通过在文本世界的任务中,将大型语言模型(LLMs)的反思结果(通过分析错误改进的行为)融入到视觉世界的相同任务中来训练一个居住在视觉世界的视觉语言模型(VLM)代理,从而使得这个多模态的具身代理(EMMA)能够快速适应视觉世界的动态,并
→
PDF
7 months ago
Prev
Next