Jan, 2025

机器人世界模型:用于机器人领域稳健策略优化的神经网络模拟器

TL;DR本研究解决了在真实环境中实现高效和可扩展机器人控制时,对稳健和具有通用性的世界模型学习的需求。提出了一种新颖的双自回归机制和自监督训练框架,能够准确捕捉复杂的部分可观测和随机动态,并在各种机器人任务之间实现适应性。通过大量实验,证明了该方法在预测准确性、噪声鲁棒性和跨任务泛化方面优于现有技术,成功实现了机器人系统的零-shot迁移。