模型基础的强化学习是控制未知系统有效的方法,本文聚焦于具有非线性参数依赖的模型,并展示了适用于一类非线性动力学问题的主动学习算法的有限样本分析。
Apr, 2024
本文提出了一种基于神经网络的深度主动学习框架,将其应用于非线性系统识别中,通过在不同输入空间区域中局部探索系统动力学,从而获得了覆盖更广泛输入空间的模拟数据集,并结合信息量测量和神经网络的预测方差等指标来实现最佳数据采集,相较于使用标准数据采集方法,本文所提出的方法在仿真数据的系统识别中表现更佳。
Feb, 2023
该论文探讨了在强化学习领域中,如何通过学习前向模型(也称转移函数、系统动力学)来近似马尔可夫决策过程中状态转移函数的过程,并提出了利用强化学习技术解决复杂动态系统学习问题的实验结果
Dec, 2022
利用贝叶斯推断、变分自动编码器和具体松弛技术,学习从局部和高维观察中获取更全面和有意义的状态空间,从而提高在各种模拟任务中学习的动态准确性的能力。
May, 2019
本文旨在通过恢复底层的低维潜在状态及其时间演化来改进动力系统的泛化能力和解释能力。我们提出了一种基于变分自编码器的实用算法,并在逼真的合成环境中进行了实证研究,证明我们能够高准确性地恢复潜在状态动力学,相应地实现高未来预测准确性,并且能够快速适应新环境。
Jun, 2024
采用深度自动编码器和预测性转移模型相结合的方法,从像素信息中学习动态系统的良好预测模型。
Oct, 2014
本文提出了一种依赖于稀疏测量数据的深度学习方法,可以对非线性系统动力学行为进行建模和状态估计,并在多个测试数据集上验证了其有效性。
Apr, 2022
引入了一个针对具有连续状态和动作空间以及非高斯转移模型的随机域的模型学习和规划框架。该框架高效,因为只有在计划器需要它们时才估计局部模型;计划器集中于当前规划问题的最相关状态;计划器专注于信息最丰富和 / 或价值最高的动作。我们的理论分析显示了所提出方法的有效性和渐近最优性。在实验上,我们在模拟的多模式推动问题上展示了我们算法的有效性。
Jul, 2016
通过模型无关的机器学习框架和储水计算方法,实现对双臂机器人操纵器的跟踪控制,仅使用部分观测状态,并且该控制框架在周期性和混沌信号方面表现出有效性和对测量噪声、干扰和不确定性的鲁棒性。
Sep, 2023
本研究针对非线性动态系统的控制问题,提出了一种通过最小化控制器损失和在任意系统中都能达到最佳实例速率的算法,该算法通过策略优化来实现优化实验设计,从而降低系统的参数不确定性。
Jun, 2023