BriefGPT.xyz
大模型
Ask
alpha
关键词
manipulation task
搜索结果 - 3
使用时间变化的自我监督学习密集奖励
本文提出了一种从多模态观察中抽取稠密奖励的更高效和更强韧的方法,在联合装配和开门两个实验设置中测试表明,这种方法在学习稠密奖励方面是有效和高效的,并且学习到的奖励导致更快的收敛。
PDF
2 years ago
OmniHang: 使用接触点对应和神经网络碰撞估计学习悬挂任意物体
本文探讨机器人是否能够学习把任意物品悬挂在各种支撑物上,并 提 出了一个系统,该系统采用部分点云图像作为输入并学习如何稳定地悬挂物品,使用深度强化学习算法来进行预测和细化,同时训练神经网络用于检测碰撞,并提供了相应的数据集。
PDF
3 years ago
利用弱配对约束调整深度视觉运动表示
提出了一种新颖的领域适应方法,将在大型易于获得的源数据集 (例如,合成图像) 上学习的视觉表示适应到目标实际世界领域,不需要昂贵的手工数据注释。作者使用弱对齐图像,结合分布对齐的方式来解决实际和模拟环境差异的问题,并在机器人操作任务上对其进
→
PDF
9 years ago
Prev
Next