- Lang2LTL:将自然语言命令转换为时间机器人任务规范
Lang2LTL 是一个基于大型语言模型的新型系统,能够提取自然语言指令中的相关表达并将其转化为机器人的任务规范,使任何机器人系统能够在无需额外训练的情况下解释自然语言导航命令并执行多步骤的导航任务,以 88.4% 的平均准确性在 22 个 - 使用遮蔽视觉预训练的真实世界机器人学习
本文研究了利用自监督学习方法从真实世界的机器人任务中的多样化视频图像中进行视觉预训练,在多种机器人任务和实体上表现出了较高效果,并通过在 4.5M 张来自互联网和自怎样视角视频的大规模数据上进行的预训练,展示了对于机器人学习的视觉预培训的规 - 开放式词汇可查询实景场景表示用于真实世界规划
本文提出了 NLMap 框架,通过先建立可查询的场景表征,为 LLM 规划器整合上下文信息,使其可以查询场景中的对象并产生上下文条件计划,从而使机器人能够实现无固定对象列表和可执行选择的真实机器人操作。
- 基于变分逆强化学习的多任务可迁移奖励学习
利用生成对抗网络框架下的多任务环境下的赋能制约技术,从无标记的专家示例中同时学习可转移的多任务奖励函数和策略,并证明其比现有的模仿学习方法具有更好的性能和数据效率。
- 使用物体感知表达式的多物体场景视觉运动控制
本文探索运用物体感知表征学习技术进行机器人任务,自监督学习方法可降低实际世界中收集大量标记数据的成本,该研究展示物体感知表征学习技术在策略学习和物体定位预测方面显著提高了当前技术的效能和表现。
- 示范对比学习
该论文提出了一个从多个视角捕捉的无标注视频演示中学习视觉表示的框架,优化了最近提出的自监督学习算法,应用对比学习来增强与任务相关的信息和抑制特征嵌入中的无关信息,验证了所提出的方法在模拟几种机器人任务,包括 pick and place 任 - 利用大规模并行深度强化学习在几分钟内学会行走
本文介绍并研究了一种在单个工作站 GPU 上使用大量并行性实现快速生成真实世界机器人任务策略的训练设置,其中包括不同训练算法组件在大规模并行模式下对最终策略性能和训练时间的影响分析和讨论,同时还介绍了一种新颖的游戏启发课程,适用于数千个模拟 - Continual World:一个用于连续强化学习的机器人基准测试
提出了 Continual World 基准,并进行了基于机器人任务的方法评估,该评估针对 Continual learning 中的前向迁移和 Catastrophic forgetting 进行优化,以提高方法在 RL 中的性能。
- AAAI使用内禀动机学习目标条件策略的深度强化学习
本文提出了一种新的无监督学习方法,名为具有内在动机的目标导向策略(GPIM)。通过将抽象级别的策略与目标条件策略联合学习,本方法在各种机器人任务中证明了其有效性和高效性,大大优于先前的技术。
- 通过价值分歧进行自动课程学习
通过提出自动课程设计和目标建议模块,来提高强化学习中的多任务目标采样效率,并在机器人和导航任务中展示了比现有方法更好的性能。
- 欧几里得流形变换:用于学习稳定动力系统的微分同胚约简
通过利用人类运动的规律性属性(例如稳定性、平滑性和有界性),将复杂运动编码为稳定动力系统的展开,进而提出一种通过有限的人类演示来学习这类运动的方法,并通过验证在已建立的基准测试和在现实世界的机器人系统上的演示进行论证。
- 动态体验回放
提出了一种名为动态经验重放(DER)的新技术,它允许强化学习算法不仅使用人类示范的经验重放样本,还使用训练期间由 RL 代理生成的成功转移,因此提高了训练效率,并演示了该方法在机器人紧密配合关节装配任务上的应用。在两项不同的任务中进行实验, - ABC-LMPC:针对可调边界条件的随机非线性动态系统的安全基于样本的学习型模型预测控制
本文提出一种可适应起点和目标配置的 LMPC 算法,旨在保证最终控制器在随机非线性系统中的期望迭代收敛,并通过实际测试表明,该控制器适用于多种初始和终端条件的控制任务。
- 大规模动态环境下的鲁棒密集建图
提出了一种基于立体输入的视觉里程计法的稠密建图算法,该算法针对大规模动态城市环境中的高级移动机器人任务,同时重建静态背景、移动物体和潜在移动的静止物体。
- FastDepth:嵌入式系统上的快速单目深度估计
本文提出了一种在嵌入式系统上实现快速单视图深度估计的高效轻量级编码器 - 解码器网络架构,涉及深度感知、机器人任务以及神经网络等关键词。在使用 NVIDIA Jetson TX2 GPU 或仅使用 TX2 CPU 时,FastDepth 可 - 闭环模拟与实现:将模拟随机化应用于现实世界的经验中
本文提出了一种基于模拟场景的策略转移方法,通过改变模拟参数分布并结合少量真实世界回合的训练,以实现在不同机器人任务中的可靠策略转移。
- 家庭机器人学习:提高泛化性能和减少数据集偏差
研究表明,大多数基于数据驱动的机器人任务都是在实验室环境中收集的大规模数据集上进行训练的,该论文提出了在人们的家庭环境中使用低成本机器人手动搬运收集数据的方法,并开发了一种框架来处理数据中的噪音标签。该模型在采集了 28,000 次抓取数据 - 利用真实世界机器人设置强化学习任务
本篇论文研究了基于实际机器人的强化学习,提出了一种学习任务并分析了实验设置对学习性能、可重复性和公平比较的影响,并为未来的实验者提供了一些缓解措施。
- 通过上下文翻译从原始视频中学习模仿行为
本研究提出了一种基于视频预测、上下文转换和深度强化学习的 “观察型模仿学习” 方法,该方法消除了标准模仿学习对于完全相同环境的假设,并能够从一个演示者的视频中学习各种现实世界中的机器人技能,涵盖扫地、铲杏仁、推物品等家庭琐事任务以及模拟中的 - NIPSQMDP-Net: 基于深度学习的部分可观察性规划
QMDP-net 是一种用于部分可观测性下规划的神经网络结构,结合了无模型学习和基于模型的规划的优势,并在预备实验中在多项机器人任务中表现出强大性能。