利用模拟器提供的潜在状态学习混合动力学模型
从数据库中无监督地学习高维时间序列的潜在动力学是一个挑战,该论文从物理归纳偏差和学习 - 识别策略的角度研究了这个问题,并提出一种新颖框架 Meta-HyLaD,用于无监督元学习混合潜在动力学,既包括已知的数学表达式又包括描述未知误差的神经函数,并通过对五个物理系统和一个生物医学系统的广泛实验证据来说明 Meta-HyLaD 整合丰富的先前知识优势并识别其与观测数据之间的差距。
Mar, 2024
通过比较使用学习动力学模型进行规划和使用基准模拟器进行规划的性能,来澄清不同设计选择对学习动力学模型的作用,首先从 DeepMind 控制套件的 5 个域的训练序列收集了丰富的数据集,然后以监督方式训练前馈动态模型,并在不同的模型设计选择包括合成,随机性,多步培训和时间步选项时评估规划器性能。
Sep, 2021
通过把任务分解成不同的部分并利用动态的不平衡性,使用 “Hindsight States” 方法使得机器人学习更加高效。在多项挑战性仿真测试和一个真正的机器人示例中验证了该方法的有效性。
Mar, 2023
该论文提出了一种用于强化学习中学习动态全局模型的方法,通过将学习全局动态模型的任务分解为学习本地动态的上下文潜向量和条件预测下一个状态来实现此目的,并通过鼓励上下文潜向量在预测正向和反向动态方面有用来编码动态特定信息。该方法在各种模拟机器人控制任务中实现了优异的泛化能力,超过了现有的强化学习方案。
May, 2020
本文研究了如何将在模拟中成功的控制策略推广到实际机器人上,通过计算模拟根据该策略期望的状态并利用深度逆动力学模型决定哪种真实世界的控制动作最适合实现这些状态,同时提出了一种数据收集方法(逐步)学习深度逆动力学模型。
Oct, 2016
本文综述了一些通过将数据驱动建模与先前的解析知识相结合的监督回归模型,以在具有刚体力学描述的系统动力学建模中提高数据的效率和物理完整性,并分析了刚体力学的各种潜在函数和算子。
Dec, 2020
本研究提出了一个新的混合离线 - 在线强化学习范式,通过使用有限的真实数据和不受限制的模拟器探索来解决两种方法的缺陷,并在通过广泛的仿真和实际任务以及理论分析中证明了 H2O 优于其他跨域在线和离线强化学习算法,从而为解决实际的复杂任务提供了全新的思路。
Jun, 2022
本文提出了一种稳定学习动态系统的方法,该方法采用联合学习动态模型和李雅普诺夫函数的方法,这样学习的系统在整个状态空间内保持稳定,同时它也能够被结合到其他深度生成模型中学习复杂的动态系统,例如视觉纹理。
Jan, 2020
提出了一种名为 PREDICTIVE STATE INFERENCE MACHINE(PSIM)的数据驱动方法,用于推断动态系统的预测状态空间,并且实现了一些基于机器人的测试。
Dec, 2015