具有保证的非线性系统辨识的主动学习
研究稳定非线性系统动力学学习问题,使用基于梯度的算法从单个有限轨迹的样本中学习系统动态,特别地,针对 entry-wise 非线性激活函数列出保证,通过数值实验验证了理论公式的正确性。
Feb, 2020
本文提出了一种依赖于稀疏测量数据的深度学习方法,可以对非线性系统动力学行为进行建模和状态估计,并在多个测试数据集上验证了其有效性。
Apr, 2022
该论文探讨了在强化学习领域中,如何通过学习前向模型(也称转移函数、系统动力学)来近似马尔可夫决策过程中状态转移函数的过程,并提出了利用强化学习技术解决复杂动态系统学习问题的实验结果
Dec, 2022
本文提出了一种基于神经网络的深度主动学习框架,将其应用于非线性系统识别中,通过在不同输入空间区域中局部探索系统动力学,从而获得了覆盖更广泛输入空间的模拟数据集,并结合信息量测量和神经网络的预测方差等指标来实现最佳数据采集,相较于使用标准数据采集方法,本文所提出的方法在仿真数据的系统识别中表现更佳。
Feb, 2023
本研究针对非线性动态系统的控制问题,提出了一种通过最小化控制器损失和在任意系统中都能达到最佳实例速率的算法,该算法通过策略优化来实现优化实验设计,从而降低系统的参数不确定性。
Jun, 2023
我们提出了一种主动学习算法,通过将先验领域知识明确纳入采样过程,利用副信息来学习动态。通过数值实验,我们证明了该策略探索了高差异区域,加速了学习过程同时降低了模型不确定性。我们还通过提供最大预测方差的收敛速度的明确速率,严格证明了我们的主动学习算法给出了底层动态的一致估计。我们在一个欠驱动的摆系统和半猎豹 MuJoCo 环境上展示了我们方法的有效性。
Mar, 2024
在已知部分观测的线性动态系统属于已知候选模型的有限集合的情况下,本文关注线性系统识别问题。我们首先考虑了给定轨迹的识别问题,利用线性最小二乘方法的最新非渐近分析进展来表征这个问题的有限时间样本复杂性,并设计了一个维度无关样本复杂性界的学习器。接下来,我们考虑了线性系统的切换控制问题,其中每个候选模型都有一个候选控制器,并通过系统与一组潜在的破坏性控制器的交互来收集数据,我们开发了一个维度相关的准则来在有限时间内检测这些破坏性控制器。我们利用这些结果提出了一个数据驱动的切换策略来识别潜在系统的未知参数,并对其性能进行了非渐近分析,并讨论了其对基于估计的监督控制方法的影响。
Apr, 2024
本研究解决了高维未知动态非线性系统控制的稳定性问题,传统强化学习算法在此任务中的表现不足。我们提出了一种新的强化学习算法,通过学习系统动力学的局部线性表示来实现稳定控制,并将学习得到的增益矩阵直接整合进神经策略中。实验结果表明,该算法在多种高维动态系统中表现优于主流强化学习算法,成功实现了系统的稳定性。
Sep, 2024