机器人运动风格的成本函数
本文主要介绍了通过学习情感空间映射来实现机器人在情感任务中的表现,通过用户反馈的学习方式,实现深度学习每个情感的代价函数,并将其映射到情感空间上,从而可以将用户反馈用于学习所有情感,生成各种情感的轨迹并做出相应表现。本文提出的方法已在多个测试实验中得到应用和验证。
Mar, 2022
通过学习 cost function 和图神经网络,我们的方法 SceneScore 能够评估目标排列的可取性,从而实现对缺失目标的姿态预测以及与其他约束条件的组合。
Nov, 2023
提出一种基于人类认知和成本评估的自适应运动规划器,以实现自动驾驶车辆在复杂地形和挑战性场景中的稳定高效行驶。通过构建多层地图描述不同的越野地形特征,并利用 CNN-LSTM 网络学习人类驾驶员在各种越野情景下规划的轨迹,设计了基于原始轨迹和成本权重选择的轨迹规划器,能生成与越野车辆动力学一致的高度自适应、稳定、高效的轨迹。在复杂地形和不同路况的沙漠越野环境中进行实验证明,提出的人类化运动规划器在不同越野条件下具有极好的适应性,实时操作、更大稳定性,并且在多样化和挑战性场景中具备更加人类化的规划能力。
Apr, 2024
利用最大熵的非线性 IRL 框架,通过采集的人类行为驾驶数据,使用 Fully Convolutional Neural Networks (FCN) 表示驾驶行为的成本模型,直接构建出代替人类驾驶行为的代价图,以此实现机器人高仿真的驾驶行为,且表现出较强的可伸缩性和鲁棒性。
Jul, 2016
我们提出了一种可微分的预测 - 规划框架,使用一个可微分的非线性优化器作为运动规划器,通过神经网络预测周围代理人的轨迹并为自主车辆优化轨迹,我们的模型使用真实世界的驾驶数据集进行训练,并在开环测试和闭环测试中得到验证,拥有比基线模型更好的性能,证明联合训练规划和预测模块比独立训练预测模块更优。
Jul, 2022
本研究提出了一种基于神经网络的端到端模型,可在用户控制下实时生成和转换不同风格的运动,无需手工制作的相位特征,在游戏系统中易于训练和部署,并从实验三个方面,即准确性,灵活性和多样性进行了评估,表现出令人满意的结果。
Mar, 2022
本文提出一种新颖的优先级概念,可表达对每个任务及其关系的偏好,并通过对 A * 搜索的扩展来生成符合用户偏好和资源优化的帕累托最优计划。同时,通过多目标 A * 算法适应性改进计算所有最优的取舍,并提出一个问题无关搜索启发式以实现可扩展性,在移动机器人和机器人操纵者上展示框架的效力,达到了 2 个数量级的加速。
Jun, 2023
训练高维模拟智能体时,利用复杂的奖励函数鼓励自然策略,并配合基于参考动作捕获数据的对抗运动先验可以使产生的行为迁移到真实机器人上,从而得到能量有效的步态转移。
Mar, 2022
通过自我监督的模仿学习方法,使用自回归时空图神经网络进行辅助饮水任务,利用多样化的人体运动轨迹数据来生成适合 UR5e 机器臂的自然而又功能性的饮水运动轨迹。
Sep, 2023
在实际场景中的字符动画需要各种约束条件,如轨迹、关键帧、互动等。我们提出了一种可编程的运动生成新范式,通过将运动控制任务分解为原子约束的组合,并将其编程到误差函数中,实现生成满足约束的运动序列,以此解决动作控制的开集问题。实验证明在处理一系列未知任务时,我们能够生成高质量的运动。这些任务包括运动动力学、几何约束、物理定律、场景、物体或角色自身部位的相互作用等,且无需收集特定的训练数据或设计特殊的网络结构。同时,我们观察到新的技能在编程新任务时的涌现,还利用大型语言模型实现了自动编程。我们希望这项工作能为通用人工智能代理的运动控制铺平道路。
May, 2024