利用预测状态推断机器学习进行滤波
本文提出并演示了一种精确学习环境模型的新算法,该算法从行动 - 观测对的序列中直接学习此类环境的模型,并通过在学习的模型中进行规划并恢复一个接近原始环境的最优策略实现从观测到行动的闭环。
Dec, 2009
这项工作介绍了物理信息化状态空间神经网络模型(PSMs),它是实现自主系统中的实时优化、灵活性和容错性的一种新颖解决方案,特别适用于化学、生物医学和电力等以传输为主的系统。通过两个硅橡胶实验 —— 加热通道和制冷系统环路,我们证明了 PSMs 比纯数据驱动模型提供了更准确的方法。除了准确性,PSMs 还具有几个引人注目的用途:通过顺序更新的状态空间表示创建非线性监控控制器以及使用来自 PDE 的残差提出诊断算法。我们进一步提出 PSMs 可以作为数字孪生的基础,不断更新的物理系统的数字表示。
Sep, 2023
我们提出了一种正则化方案,简化了世界模型的潜在动态,使得动态软件状态的不变性更强、智能体行为的效果更可预测。通过结合三种不同的模型类别,我们发现该正则化方案能够提高准确性、泛化性和后续任务的性能。
Jan, 2024
本文研究了高斯过程状态空间模型的主动学习。通过决定其输入,我们可以通过 GPSSM 最优地学习系统的潜在状态,以便选择最具信息量的输入。我们提出了两种逼近潜在状态下 GPSSM 的互信息的方法,并在多个物理系统中进行了评估。
Jul, 2021
本文研究了在线强化学习在部分可观测动态系统中的应用,提出了一种基于模型的算法,通过可观测量学习了一个近似最优策略,其样本复杂度与系统的有关参数呈多项式关系。该算法自然地支持函数逼近,可处理具有潜在大状态和观测空间的系统,并且在一些特殊模型中也得到了有效应用。
Jul, 2022
本研究提出了一种压缩 PSR(预测状态表示)的学习方法,结合降维、增量矩阵分解和压缩感知等技术,用于模型学习和规划。该方法提供了一个原则性的途径来学习 PSR 的准确近似,大大降低了学习的计算成本,并提供了有效的正则化。
Dec, 2013
深度学习和可解释人工智能领域的研究。介绍了 Projective Simulation 和 Multi-Excitation Projective Simulation 方法以及与超图可视化的应用,通过量子多体物理的少体相互作用模型解决超图的复杂性问题,并在实验中展示了资源节约和可解释性的方面。
Feb, 2024