robotic manipulation tasks | BriefGPT

关键词robotic manipulation tasks

搜索结果 - 16

利用能力促进大型语言模型在机器人操纵方面的应用
大型语言模型在完成各种语言处理任务方面很成功，但在生成适当的控制序列时很容易与物理世界互动失败。我们发现主要原因是 LLM 没有与物理世界紧密连接。与现有基于 LLM 的方法相比，我们旨在解决这个问题，并探索在无训练范式下促使预训练 LLM
PDF3 months ago
MOKA：基于标记的视觉提示的开放词汇机器人操纵
利用开放词汇泛化的方法，本文提出了 MOKA（标记开放词汇关键点可利用性）来使用视觉语言模型解决由自由形式语言描述的机器人操作任务，通过在图像上注记关键点和航点的预测，将问题转化为视觉问答问题，并通过上下文学习和策略精炼提升性能，验证并分析
PDF4 months ago
傅立叶传输器：三维双等变机器人操作
利用傅里叶转换器在复杂机器人操作任务中提高样本效率，通过训练和预测新环境下的拾取 - 放置动作来实现开环行为克隆方法，并独立考虑拾取和放置动作的对称性，取得了在 RLbench 基准测试中的最新成果。
PDF5 months ago
基于图注意力的多级重组规划的结构概念学习
通过结构概念学习（SCL）和图注意力网络，提出了一种多层次的物体重新排列规划方法，用于复杂和任意环境中的机器人操作任务，并通过对场景的理解实现更好的性能、灵活性和效率。
PDF10 months ago
鲁棒的视觉从模拟到实际的机器人操作转移
通过在模拟环境中学习视觉运动策略，我们提出了一种通过视觉域随机化方法来解决模拟与真实世界之间差异的问题，并在丰富的机器人操作任务中进行了基准测试。我们的方法在各种挑战性的操纵任务中取得了 93% 的成功率，并证明了模拟器训练的策略在真实场景
PDFa year ago
Instruct2Act：使用大型语言模型将多模态指令映射到机器人动作
本文介绍 Instruct2Act 框架，利用大型语言模型将多模态指令映射为机器人操作任务所需的 Python 代码，采用 Segment Anything Model (SAM) 和 CLIP 等基础模型有效定位和分类物体，实现高效的机器
PDFa year ago
Few-Shot Imitation Learning 通过查询未标记的数据集进行行为检索
本研究通过利用少量下游专家数据有针对性地获取有关未标记数据集的信息，设计了一种新颖的机器人学习方法以有效地学习视觉运动技能。该方法效果显著，在通过视频实景测试和实际机器人操作中超越了以往更为复杂的目标设定方法 20% 的表现
PDFa year ago
ICLR预训练视觉模型的无损调整在机器人操作中的应用
本文提出 “无损调适” 方案，以解决 fine-tuning 过程对预训练模型通用性的破坏，实验证明此方案在各种任务和模型（ViTs，NFNets 和 ResNets）上表现良好。
PDFa year ago
草莓团控深层功能预测控制及触觉预测
本文提出了一种基于数据驱动前向模型和机器人触觉预测的新方法来解决机器人推动任务中的物理机器人交互问题，并将该模型融入到深度函数预测控制系统中，以控制物体的位移。实验结果表明，该控制器可以成功地控制机器人操纵任务中的物理机器人交互问题，并能够
PDFa year ago
面具世界模型的视觉控制
通过自编码器和动态学习的分离以及辅助奖励预测目标的引入，提出了一种新的视觉模型 RL 框架，取得了 Meta-world 和 RLBench 的 50 项任务中，81.7% 的成功率的表现。
PDF2 years ago
从野外人类视频中学习通用机器人奖励函数
该研究提出了使用 Domain-agnostic Video Discriminator (DVD) 的方法，通过对分类视频完成相同任务的数据进行学习，实现多任务奖励功能的广义推理。通过将人类数据集与机器人数据相结合，该方法可以在未知环境中
PDF3 years ago
元世界：多任务和元强化学习的基准和评估
本文提出了一个开源的模拟基准测试，包含 50 个不同的机器人操作任务，以评估 7 种最先进的元强化学习和多任务学习算法在这些任务上的表现，发现这些算法在解决多任务时仍存在挑战，为未来的研究提供了实验环境。
PDF5 years ago
任务相关的对抗性模仿学习
本文探讨对抗模仿领域中鉴别器网络学习视觉特征与专家标签之间的虚假关联所造成的关键漏洞，并提出了一种新的解决方案 (TRAIL)，该方法通过优化受限的鉴别器来获得 informative rewards。在实验中，我们展示了 TRAIL 能够
PDF5 years ago
透过事后目标生成进行探索
本文介绍了一种基于目标导向的强化学习新算法框架 Hindsight Goal Generation，该框架通过生成有助于智能体在短期内实现的前瞻性目标以指导其在长期内实现实际目标的路径，以显著提高采样效率和处理奖励稀疏性问题。在多项机器人操
PDF5 years ago
残差策略学习
本文介绍了一种简单的方法 —— 残差策略学习（Residual Policy Learning，RPL），用于改善使用模型自由深度强化学习来提高非可微策略。我们在面对复杂的机器人操作任务时，研究了 RPL 的应用，这些任务中存在良好但不完美
PDF6 years ago
针对多样化视觉动作技能的强化学习和模仿学习
该研究提出了一种模型无关的深度强化学习方法，利用少量的演示数据来协助强化学习代理。作者将该方法应用于机器人操作任务并训练了端到端的视觉 - 动力学策略，直接从 RGB 相机输入到关节速度。实验结果表明，与仅使用强化学习或模仿学习训练代理的结
PDF6 years ago