- SPEAR:接收器对接收器声学神经扭曲场
我们提出了 SPEAR,这是一种连续的接收器到接收器声学神经弯曲场,用于在一个声学三维空间中预测声学效应,具有单个静止音源。与传统的从源到接收器建模方法不同,该方法需要先验的空间声学特性知识来严格建模源到接收器的声音传播,我们提出通过将空间 - ICLR特权感知基座加强学习
通过感官支承和特权感知,提出了一种强化学习方法,用于改进训练策略;并设计了一套多样的模拟机器人任务来评估这种方法。
- TaCOS: 任务特定仿真相机优化
通过将无导数和基于梯度的优化器结合,利用计算机图形学技术和物理摄像头特性,我们提出了一种新颖的端到端优化方法来为特定机器人任务设计摄像头,通过软件原型设计摄像头、模拟操作环境和任务以及优化摄像头设计,从而提高机器人在其应用中的性能。
- 学习任务对称机器人策略的对称性考虑
通过数据增强和镜像损失函数的两种方法,将对称不变性纳入深度强化学习中,可在各种具有挑战性的机器人任务中实现更快收敛和改进的学习行为。
- ICLR基于语言引导的状态抽象学习
使用自然语言设计状态抽象来实现模仿学习的框架,该框架利用语言模型的背景知识和自然语言监督,自动构建针对未见任务的状态表示,并证明其提高了泛化性和稳健性,缩短了设计时间。
- 可验证和组合式的多信度模拟到现实强化学习流水线
我们提出并展示了一种用于训练和验证强化学习系统的组合框架,在多功能度的仿真到实际应用中,以便在物理硬件上部署可靠和适应性强的强化学习策略。通过将复杂的机器人任务分解为组成子任务,并定义它们之间的数学接口,该框架允许对相应的子任务策略进行独立 - TIAGo RL:移动机器人的模拟强化学习环境与触觉数据
本研究通过深度强化学习技术在机器人领域实现了触觉信息处理、迁移学习、以及力控制等方面的初步成果。
- RT - 轨迹:通过事后轨迹草图实现机器人任务的泛化
该研究论文探讨了使用粗略轨迹草图作为任务表示的方法,称为 RT-Trajectory,该方法通过有效地执行新任务,克服了现有语言条件和目标条件策略的局限性,具有广泛的泛化能力。
- 将生成模型微调作为机器人任务推理方法
通过快速微调模型来适应生成样本与观察证据匹配是一种适用于各种深度生成模型和机器人环境的简单而通用的方法。该方法可应用于自回归模型和变分自动编码器,并在物体形状推断、逆运动学计算和点云完整性方面展现了其可用性。
- 通用视觉分解器:简化长时控制
通过提出 Universal Visual Decomposer (UVD) 作为一种针对视觉长时程操作的通用任务分解器,该方法基于预训练的视觉表示,通过检测嵌入空间中的相位变化来发现子目标,并在零附加训练成本的情况下在标准视觉运动策略训练 - CasIL: 通过双重认知行为架构认知和模仿技能
通过人机互动,引入直观的人类认知先验,提出一种新的基于认知 - 动作的技能模仿学习 (CasIL) 框架来帮助机器人有效地认知和模仿关键技能,取得了与其他对手相比在各种长程机器人任务中具有竞争力和鲁棒性的技能模仿能力。
- 信号时态逻辑神经预测控制
通过直接学习神经网络控制器以满足信号时间逻辑 (STL) 的要求,以确保长期机器人任务的安全性和满足时间规范的挑战。同时,采用备用策略以保证控制器故障时的安全性。该方法可以适应不同的初始条件和环境参数,并在复杂的 STL 规范任务中以 10 - FDCT:透明物体的快速深度补全
提出了一种适用于透明物体的快速深度补全框架(FDCT),通过利用局部信息和设计新的融合分支和捷径,以及使用损失函数来抑制过拟合问题,实现了准确且易于使用的深度矫正框架。该框架可以仅通过 RGB-D 图像恢复稠密深度估计,运行速度约为 70 - 欧几里德对称性在强化学习和规划中可行吗?
该研究论文探讨了改进机器人任务中有对称性的强化学习和规划算法的设计,算法在处理具有欧几里德群对称性的问题时表现出更好的性能。
- 通过自适应评分学习提高交互式强化学习的反馈效率
本文提出了一种新的方法,使用由人提供的分数代替成对偏好,在交互式强化学习中提高反馈效率,该方法在机器人运动和操作任务中得到广泛评估,结果表明,该方法可以通过自适应学习从分数中高效学习接近最优策略,而无需像成对偏好学习方法那样需要更少的反馈。
- 利用检测和恢复计划执行失调来使语言模型回归基础
本文提出了 DoReMi,这是一个新颖的语言模型基础框架,旨在检测计划和执行之间的不一致并从中恢复,实验表明,与其他模型相比,DoReMi 可以提高任务成功率并缩短任务完成时间。
- 不用手就行啦!自我中心视频的智能体 - 环境因子分离
通过视角来对分离人体和环境因素,提出了一种有关 Egocentric 视角的机器人任务的可行性的方法,并利用 Video Inpainting via Diffusion Model (VIDM)来提高 egocentric 视频修复质量, - 机器人操作中学习实际密集物体描述的模拟到真实转换
本研究提出了一种名为 Sim-to-Real Dense Object Nets (SRDONs) 的密集对象描述符,可实现从虚拟到真实环境的机器人物体识别一致性,并能够映射到一个统一的特征空间。在实验中,我们证明预训练的 SRDONs 可 - 基于强化学习的深度机器人可供性学习的最新进展
本文综述了近期深度机器人可支配学习 (DRAL) 的研究进展,该方法致力于开发数据驱动的方法,使用可支配性概念辅助机器人任务,对机器人任务的技术细节和局限性进行了分类和讨论,并从观察、行为、可支配性表达、数据收集和实际部署等方面总结了它们的 - 教机器人钓鱼:从一分钟演示中学习多功能模仿
FISH is a versatile imitation learning approach that can achieve an average success rate of 93% on robotic tasks by comp