从多模态时间序列数据中学习序列潜变量模型
为了预测智能与健壮的复杂动态环境下未来的多个目标路径,该论文提出了基于概率的框架来学习表示语义多模态未来的潜在变量,其中利用动态基于注意力的状态编码器学习编码智能体之间的交互,可被用于车辆轨迹预测。
Nov, 2019
本文研究如何通过强化机器学习模型的物理先验知识来解决物理图像理解问题,提出了一种包含 17 个物理系统的数据集,对当前物理启发式机器学习方法进行了细致的对比分析,结果表明尽管这些方法通常可以学习到具有良好性质的隐藏空间,但没有显著提升标准技术的性能。
Nov, 2021
本文提出了一种名为MILD的多模态交互潜在动力学方法,将深度学习和概率机器学习结合起来,用于学习人与机器人之间的互动动力学,并在人-人互动的演示中进行了实验验证,该方法比相关研究生成更准确的机器人轨迹,还能够直接从基于摄像头的姿势估计中学习生成轨迹。
Oct, 2022
这篇论文介绍了一种层级建模范式,结合了概率回归模型和贝叶斯非参数方法,采用了一种逼近非线性函数的局部回归技术,提出了两种有效的变分推理技术来学习这些模型,此方法可适应数据并涵盖无限数量的组件,本文对大型逆动力学数据集进行了验证和测试。
Nov, 2022
提出了一种方法,通过在一种框架内结合变分自动编码器和(时空)注意力机制,从高维经验数据中学习动力系统,以实现确定一定科学动力学不变的设计,这种方法允许在任何连续时刻有效推断系统行为,是从异构数据中高效学习动态模型的一种有前途的新框架。
Jun, 2023
研究使用视频数据进行决策预训练表示学习,讨论两种情景:观察中的独立同分布噪声和存在外部噪声的困难情景,验证了在不同情境中学习表征方法的样本复杂度和性能表现。
Mar, 2024
本研究针对传统学习示范中模型复杂性和规模适应性不足的问题,综述了深度生成模型在机器人学习中的应用进展。通过探讨不同类型的深度生成模型及其在抓取生成、轨迹生成等应用中的表现,这项工作揭示了提升模型泛化能力的关键决策,并指出了未来研究的挑战和方向。
Aug, 2024
本研究针对现有多模态生成模型在信息捕捉上的局限性,提出了一种将能量模型(EBM)与多模态潜在生成模型相结合的新框架。该框架通过变分方法联动训练,提高了先验模型的表现力和信息捕捉能力,实验结果证明了其在生成一致性上的优越性。
Sep, 2024
本研究解决了现有扩散政策在性能与行动时间范围之间的权衡问题,提出了一种新颖的潜在权重扩散方法(LWD),通过在潜在空间中学习策略分布,以生成更小的策略网络并减少推理查询。实验表明,在Metaworld MT10基准上,LWD在实现更高成功率的同时,推理模型规模可减少约18倍,且在较长行动时间范围内表现优于传统扩散政策。
Oct, 2024
本研究解决了机器人系统在与现实世界互动时如何稳健地整合多模态信息的问题。我们采用变分自编码器(VAE)架构,并引入信息论度量,以分析不同模态在数据重构中的重要性。研究发现,不同模态的融合显著影响了输入数据的重构效果,提升了机器人的控制能力。
Nov, 2024