- 自动密集奖励函数生成器:强化学习的应用
使用 Text2Reward 框架,基于大规模语言模型生成紧凑环境的密集奖励函数,实现对机器人操纵和运动任务的迭代优化,在 13 个操纵任务中成功率优于或与专家编写的奖励函数相当,对于运动任务,成功率超过 94%,证明在模拟和真实世界中均具 - CVPR神经体积记忆用于视觉行动控制
利用单目深度相机、神经体积记忆和几何先验知识,提出了一种新的方法来解决多种恶劣地形条件下的机器人步态规划问题。
- 机器人运动的 DeepCPG 策略
本研究利用中央模式生成器(CPGs)构建深度强化学习的 DeepCPG 策略层来实现多腿机器人的行走行为,证明其在高维传感器空间中具有实验有效性,并进一步通过模块化机器人和多智能体深度强化学习的方法来推广其应用,展示了生物学原理所建立的更高 - 使用自我中心视觉在具有挑战性地形中进行腿式 locomotion
本文介绍了一种用于四足机器人的端到端行动系统,结合了深度学习和增强学习技术,通过使用单个摄像头实现台阶、路障、石头和洞口的通过,能够快速在不同的地形上行动和适应各种推挤和摩擦,同时保持稳定。
- 使用强化学习创建动态四足机器人守门员
我们提出了一个基于强化学习的框架,使得四足机器人在真实世界中执行足球门将任务。
- DMAP: 基于分布式形态学的注意力策略,在机体变化中学习行走
我们在四个经典的连续控制环境中研究了生物和人工智能需要应对不断变化的问题,发现基于生物启发的控制策略可以帮助实现强大的感觉运动任务学习,我们提出了一种基于注意力机制的 DAMP 网络结构,通过对身体不同部位的传感器信息进行动态门控,实现对形 - 分布式优化实现多肢机器人自由攀爬的同时接触丰富抓握和运动
提出一种高效的运动规划框架,基于 ADMM 分布式优化框架,使用 MIQP 和 NLP 解决接触和非线性动力学问题,显式强制执行微刺夹具的限制面环接触约束,通过硬件实验演示了多肢机器人能够实现各种动作。
- 基于策略分解的人工智能共享控制
本文介绍了一种基于频率的方法(Policy Dissection)用于 Reinforcement Learning (RL) 方法中的人机共享控制,该方法可将 RL 训练过的策略转化为可以与人类互动的策略,并在自动驾驶和动力学任务中进行了 - 约束进化体现神经智能的共同设计
通过深度强化学习和进化算法以及用户控制相结合的方法,介绍了一种创新的协同设计方法,以形态属性和运动为自主移动代理提供良好的设计和行为。
- 基于压力的软体智能体形态变化与控制
本文介绍了一种新的软体智能体形式学 PSAs,通过对其控制压力实现了在崎岖地形和从笼子中逃脱等任务中的运动,这对于软体智能体的建模具有重要意义,包括软机器人和生物细胞。
- 学习野外四足机器人鲁棒感知运动
该研究提出了一个通过注意力机制进行运动控制的算法,将内部和外部感知模式结合,以提高遗憾机器人在恶劣环境下并发控制的速度和稳定性。
- MUGL:大规模多人条件动作生成与运动
介绍了 MUGL,这是一种新型深度神经模型,用于大规模、多样化地生成基于单人和多人姿势的动作序列。该方法可通过动作类别实现可变长度的生成,并使用条件高斯混合变分自编码器建模潜在生成空间,以在类别内 / 类别间呈现多样性。
- 自适应四足动物运动的多专家学习
本研究提出了一种多专家学习架构 (MELA),该架构能够利用神经网络来生成适应性技能,并通过传递神经网络的学习,获得更多的特殊和过渡性技能,以产生适应性行为。该方法利用专家技能和快速的在线综合适应性策略的优势,在改变任务的情况下生成响应性的 - 通过形状变化适应环境的软机器人
本文研究软机器人的形状变形如何实现在平坦和倾斜表面上的运动,通过模拟、仿真和实物实验,我们探索了该机器人在不同环境中运动的表现和性能,并发现形状变形使机器人在模拟和实际环境中比不变形机器人更优秀。
- ICLR旋转不变运动的目标条件批量强化学习
提出一种新颖的方法,使用批量 RL 设置学习目标条件策略,通过使用非目标条件策略收集批量数据,利用数据增强生成不同方向下相同动作的轨迹,并使用编码器学习不变性,从而学习到可让智能体在任何方向上行走的目标条件策略。
- 调节轨迹生成器的政策
本文提出了一种利用简单策略调制轨迹生成器的体系结构,通过深度强化学习和进化策略学习出具有可控行为的四足机器人运动,实现了从 IMU 观测数据中控制速度的步态诱导。
- 采用分层式 Sim2Real 实现的多智能体运动操控
采用强化学习方法通过层次性模拟实现在多移动机器人协作下的操纵行为。
- 基于 GPU 加速的分布式强化学习机器人仿真
使用 GPU 加速物理引擎 NVIDIA Flex 模拟机器人学习在连续控制和运动任务上表现出了极大的优势,使用少量的 CPU 与单 GPU 即可短时间内训练出高效的机器人智能。
- CVPR基于超像素分割的 3D 地标跟踪器,用于神经科学和生物力学研究
本文介绍了一种使用 SLIC 超像素方法进行标记分割的方法,使得对跑步啮齿动物的运动学分析变得更加准确、自动化,并最终实现对标记的 95% 正确分割。