- 跨身份机器人操作技能的潜空间对齐传输
本文的研究重点是在具有不同形态的机器人操纵器之间传递控制策略。通过将源机器人和目标机器人的状态和动作空间投影到一个共同的潜在空间来实现跨机器人的策略转移。我们使用编码器、解码器和潜在空间控制策略同时进行训练,利用任务表现、潜在动力学一致性和 - 用于编排双臂机器人的大型语言模型
利用大型语言模型(LLM)的语言感知和上下文学习能力,开发了基于 LLM 的双手动作协调系统(LABOR Agent),用于解决双手操作任务的时空协调问题,并通过在仿真环境中测试实验证明其接近最优性能。
- 演员 - 评论员物理告知的神经李雅普诺夫控制
使用 Zubov 的偏微分方程方法训练神经网络控制器和其对应的李亚普诺夫证书,以提高控制策略的吸引域范围。
- 一个基于数据驱动和多智能体的集装箱码头时段管理决策支持系统:以鹿特丹港为案例研究
模型基于大样本历史数据,采用上下文感知并综合多个模块进行协同工作,旨在预测和控制货车到达终端大门的时间,以提高物流效率和交通流畅。
- 信号时态逻辑导引的学徒学习
通过将描述高层任务目标的时间逻辑规范编码为图形来定义基于时间的度量,以改进推断奖励和策略的质量,实验表明我们的框架通过极大地提高学习控制策略所需的演示数量,克服了之前文献的缺点。
- 通过可区分的硬件模型代理使用强化学习的设计协同优化(MORPH)
我们介绍了一种使用强化学习在模拟中对硬件设计参数和控制策略进行联合优化的方法 MORPH。MORPH 依赖于被优化的硬件模型,通常是基于物理定律进行模拟,为了有效地集成此类模型,我们引入了一个可微分的代理硬件模型,通过 RL 可以有效地进行 - 稳定以行动:学习协调的双手操作
借鉴人类,提出了一种新颖的角色分配框架:一个稳定的手臂将物体固定在原位以简化环境,而另一个执行手臂执行任务。通过 BimanUal Dexterity from Stabilization (BUDS) 实现了该框架,并在真实世界的机器人上 - 用深度强化学习控制 Solo12 四足机器人
在本论文中,我们首次实现了基于深度强化学习的韧性端到端控制器在 Solo12 四足机器人上的应用,通过学习关节阻抗参考值来实现。我们详细介绍了学习过程和在真实机器人上的迁移方法。在实验中,我们展示了 Solo12 机器人作为一个开放源码平台 - 反馈即所需:基于近似物理模型的真实世界强化学习
本文提出了一种基于策略梯度的策略优化框架,可以通过可能高度简化的一阶模型对实际数据进行监督学习,从而设计出精确的控制策略。
- ArrayBot: 通过触觉实现通用分布式操作的强化学习
本文介绍了 ArrayBot,一种由 16×16 个垂直滑动支柱和触觉传感器组成的分布式操作系统,可以同时支持、感知和操作桌面上的物体。尝试通过利用强化学习算法自动发现控制策略实现可推广的分布式操作,该命题在考虑在频域中的空间本地操作和低频 - ICML提高分子动力学模拟中探索空间的控制能力,通过生成控制策略优化从头分析
本研究引入了 P5 模型,它利用强化学习技术增强分子动力学模拟的控制、效率和可伸缩性,通过优化靶聚合物链构象的采样方式,提高了效率超过 37.1%。由强化学习引起的控制策略作为归纳偏置,调制布朗力以引导系统进入优选状态,并扩大了配置空间的探 - 马尔可夫决策过程中的一致离线评估
提出了一种基于符合预测的 OPE 方法,可以在给定的一定置信水平下输出包含目标策略真实奖励的区间,并通过不同的方法处理由于目标策略和行为策略之间差异导致的分布偏移,并在保持相同置信水平的情况下,相对于现有方法降低区间长度。
- 浮力辅助腿式机器人的残差物理学习和系统识别用于机器人政策的模拟与现实转移
该论文研究了通过系统识别和一种新的残余物理学习方法 —— 环境模仿,实现对 Buoyancy Assisted Lightweight Legged Unit (BALLU) 机器人控制策略的鲁棒性模拟到实际环境的迁移,以及最终在硬件上成功 - 机器化面团成形
本研究主要研究了如何使用机器人手臂和多种传感器将软饰物(dough-like deformable material)进行操作并且变形成一个指定的二维形状,并从控制策略和操作技巧等多方面进行了探究,实验结果表明使用指定的方式对软饰物进行操作 - 预训练视觉模型对控制的有效性不足为奇
研究表明,预训练的视觉表示方法对于控制任务的学习同样有效,甚至在某些情况下可以优于基于真实状态的表示方法,而这些预训练模型仅需要使用标准视觉数据集,而不需要在目标环境中使用真实数据。
- 四足行走安全强化学习
本文提出了一种安全的强化学习框架,用于设计控制策略,以确保腿部运动的安全,同时利用无模型的强化学习进行学习任务。在此框架基础上,本文进行了四项步态运动实验,并实现了显著的提升,包括节能、稳定性和动作变化。
- 智能磁性微机器人通过深度强化学习学会游泳
研究开发出了智能螺旋状磁性水凝胶微型机器人,并通过深度强化学习算法自主推导出控制策略,使其在未经表征的仿生流体环境下受控于三维电磁铁阵列产生的变时磁场游泳。
- 利用模拟优化改进四旋翼零样本策略转移
本研究提出了一种数据驱动方法来优化模拟参数,实现从模拟到实际四旋翼的直接控制,通过强化学习的方式训练低级控制器需要比高级控制策略更精确的模拟。
- 双足步态中的摔倒预防与安全学习控制策略
本论文提出了使用深度强化学习技术为双足机器人和协助机器人开发抗跌倒控制策略,涵盖了关键词:双足动物运动,机器人技术,跌倒预防,深度强化学习和控制策略。
- 通过生成模型实现鲁棒强化学习的样本复杂性
该研究提出了一种基于模型的强化学习算法,用于学习在标准和不确定的模型下最优的稳健控制策略,并考虑了不同形式的不确定性集合