universal policy | BriefGPT

关键词universal policy

搜索结果 - 5

用于高效普适形态控制的形态条件化超网络蒸馏
通过 HyperDistill 方法，我们能够在不同机器人形态之间学习一种通用策略，从而显著提高学习效率，并且实现对未见过形态的机器人的零 - shot 泛化，同时保持了与 transformers 相似的性能和与 multi-layer
PDF5 months ago
UniDexGrasp++: 基于几何感知课程和迭代综合 - 专业学习改进灵巧抓取策略学习
提出了一种新颖的物体不可知的方法，用于从现实的点云观察和自我感知信息中学习通用的策略，实现桌面设置下的精细物体抓取，采用了几何意识课程学习和几何意识迭代通用 - 专家学习的方法，提高了泛化性能，成功率分别达到了 85.4% 和 78.2%。
PDFa year ago
通过上下文调节实现通用形态控制
该论文提出了一种分层架构，通过上下文调节来更好地模拟机器人控制策略对其形态上下文的依赖关系，其中包括两个关键子模块：（1）使用超网络生成依赖形态的控制参数；（2）提出了一种形态依赖性的注意机制来调节机器人不同肢体之间的交互。实验结果表明，该
PDFa year ago
多机器人迁移学习的硬件条件策略
通过训练一种基于机器人硬件表征向量的通用策略的新方法，我们可以在仿真中用多样化的机器人动力学，运动结构，运动长度和自由度来实现零样本迁移和现场调整，并证明了硬件有条件的策略对于普遍化和传递的良好性。
PDF6 years ago
面向未知预测：基于在线系统认知学习通用策略
通过利用物理模拟器生成的大量训练样本，我们提出了一种新的学习控制策略的方法，该方法可以成功地在未知的动态模型下运行。我们的系统由通用策略（UP）和在线系统识别（OSI）函数两部分组成，通过 UP 的训练和在系统状态下提供的来自 OSI 的
PDF7 years ago