多智能体动态的概率对称性
本文提出了一种新型模型 ECCO,利用流体动力学的认识来考虑真实世界轨迹中的内部对称性,该模型使用旋转等变连续卷积来嵌入系统的对称性,提高了轨迹预测的精度和物理一致性,具有更高的样本效率。
Oct, 2020
通过使用 EqMotion 等价粒子和人体预测模型以及多模态预测机制,我们的模型在较少参数(120 万)和显著减少的训练时间(少于 2 小时)的情况下实现了最先进的性能,实现了多智能体车辆运动预测任务。
Oct, 2023
该研究提出将对称性引入卷积神经网络中,从而提高其在预测物理动态方面的准确性和泛化能力,该方法在实验和理论上都表现出了对分布转换的鲁棒性,并且在雷利 - 贝纳对流和真实世界的海洋表现上比传统方法更优秀。
Feb, 2020
本文提出了 EqMotion,一种高效的等变运动预测模型,其中包括等变几何特征学习、不变交互推理和不变模式特征学习等模块,并在四个不同的场景下进行了实验,结果表明我们的方法在所有四个任务上都取得了最先进的预测性能,提高了 24.0/30.1/8.6/9.2%。
Mar, 2023
该研究提出了一个基于模型的强化学习框架,将主动探索和不确定性感知部署这两个任务结合了起来,通过 Jensen-Renyi 分歧量化确定性,最终在自主驾驶车辆和轮式机器人上进行了成功的实验。
May, 2023
该论文提出了一种利用机器人系统对称性学习动态的新方法,通过设计基于神经网络的对称对象组来考虑机器人系统的几何先验知识,实现了对少样本数据实现系统动态的扩展和精准的控制,同时与现有模型相比,该方法使用更少的训练数据实现了更好的泛化。
Oct, 2022
在自动驾驶中,深度学习实现的动作预测是一个热门话题。这项研究引入了一种具备几何等变性和交互不变性的突破性移动预测模型 EqMotion,在自动驾驶中融合了代理等变的高清地图特征,实现了上下文感知的准确运动预测。这些技术的应用使得我们的模型在保持轻量设计和高效数据利用的同时,能够实现高准确度的预测。
Oct, 2023
本文重点研究了自然界中对称模式的识别和分析,在物理学中导致了引力定律的制定和化学结构研究的进展。我们着眼于利用某些协同多智能体强化学习问题中固有的欧几里得对称性,该问题在许多应用中普遍存在。我们首先形式化地表征了一类具有对称最优值和策略存在性的马尔科夫博弈的子类。在这些属性的基础上,我们设计了具有对称约束的神经网络架构,作为多智能体演员 - 评论家方法的归纳偏见。这种归纳偏见在各种协同多智能体强化学习基准测试中表现出优越的性能,以及在具有重复对称模式的未见场景中进行的零样本学习和迁移学习等令人印象深刻的泛化能力。代码可在此 https URL 获取。
Aug, 2023
本文介绍了一种基于神经网络的概率建模方法,该方法能够自动产生相对应于不同情况下不变性变化的概率分布,这种方法被称为等变概率神经模拟(EPNS),其应用于随机 n 体系统和随机细胞动力学的模拟结果表明,EPNS 比现有的神经网络方法具有更高的数据效率、回溯稳定性和不确定性量化能力,显示出在高维动态系统中产生精确的概率仿真的优越性。
May, 2023
本研究旨在利用基于不确定性的深度网络动态模型来提高回报函数学习算法的样本效率,并通过样本传播方法实现不确定性处理,从而解决参数化函数逼近器,如深度网络的性能下降问题,我们提出了一种名为 PETS 的新算法。与深度强化学习的先进算法进行比较,结果表明我们的方法可以在 Asymptotic Performance 上与模型自由算法匹配,并且在许多具有挑战性的基准任务中需要明显较少的样本数量(例如,在半猎豹任务中所需样本数量比 Soft Actor Critic 和 Proximal Policy Optimization 分别减少 8 倍和 125 倍)。
May, 2018