Oct, 2024

GR-2:一种具有网络规模知识的生成视频-语言-动作模型,用于机器人操作

TL;DR本研究提出了GR-2,一个先进的通用机器人代理,旨在解决机器人操作中的可变性和广泛适应性问题。通过对3800万个视频片段进行大规模预训练,GR-2能够在多种任务和新环境中实现97.7%的成功率,展现出卓越的多任务学习和泛化能力。此项研究为机器人技术的进一步发展和实际应用提供了重要的贡献。