- 非线性深度神经网络建模的高效模型预测控制
该研究论文提出了一种用于动态系统的模型预测控制(MPC)方法,该方法利用深度神经网络(NNs)对系统的非线性和不确定性进行建模,并提出了两种用于解决 MPC 问题的方法:混合整数规划(MIP)方法和线性松弛(LR)方法。进行了广泛的数值模拟 - 基于正则化的深度状态空间模型中的高效持续学习
深度状态空间模型 (DSSM) 在动态系统建模方面的能力使其在近年来受到广泛关注。然而,现有 DSSM 方法仅适用于单任务建模,需要在重新访问之前的任务时使用历史任务数据进行重新训练。为了解决这个问题,我们提出了一种连续学习 DSSM (C - 通过深度强化学习实现现实世界流体引导刚体控制
近期增加在强化学习实际应用方面的研究,依赖于能够在规模上准确模拟系统。然而,液体动力学系统等领域展示了复杂的动态现象,难以以高积分速率进行模拟,限制了现代深度强化学习算法在昂贵或安全关键硬件上的直接应用。在本研究中,我们引入了 “Box o - 通过神经 ODE 在李群上对 SE (3) 进行最优潜力塑形
基于有限维李群的动态系统优化的新方法,将动态系统重新表述为所谓的神经常微分方程 (neural ODEs),并在李群上制定优化问题,提出了一种梯度下降优化算法来解决数值优化问题。
- 通过强化学习在动态系统中找到公平性的平衡点
在这篇论文中,我们研究了在顺序决策中存在着动态系统的公平性问题,提出了一个基于马尔可夫决策过程的算法框架,通过预处理和处理中方法集成各种公平性考虑,平衡传统公平性、长期公平性和效用。
- GSP-KalmanNet: 通过神经辅助的卡尔曼滤波跟踪图信号
该研究在动态图信号系统中利用 GSP-KalmanNet,通过结合图信号处理和深度学习技术共同追踪隐藏的图状态,来实现提高准确性、运行时间性能和鲁棒性的目标。
- 神经谐振盒:一种可解释的非线性动态系统识别的深度结构及其在音频处理中的应用
提出一种用于建模动态系统的因果可解释深度结构,通过在时频域建模系统并保持高时域和频谱分辨率,通过一种顺序递归的方式构建模型,以实现快速、强健和精确的二阶优化,无需显式的 Hessian 计算,利用神经网络识别频率之间的相互依赖,通过非线性系 - 社交网络中基于观点动力学的神经消息传递的统一视角
我们提出了一种基于有界置信度的信息传递框架 ODNet,将社会网络和神经信息传递的概念相结合,用于分析和推断动态系统的行为。通过调整有界置信度和影响力权重,并定义与社交网络图特点一致的观点交换规则,我们的方法能够简化复杂的社交网络图,准确识 - 基于动态期望最大化的彩色噪声下自适应噪声协方差估计
通过脑启发算法准确适应地估计动态系统中受彩色噪声干扰的噪声协方差矩阵,并实现在线噪声协方差和状态估计,优于其他九种基准方法。
- Wordle 的强化学习方法:一种 POMDP / 自适应控制方法
本文利用新的增强学习方法解决了流行的 Wordle 谜题,这种方法广泛适用于动态系统的自适应控制和部分可观察马尔科夫决策过程(POMDP)问题的类别,并且优于多种启发式方法;该方法可提供逼近值空间和 rollout 方法的直接实现,并在较低 - MM量化先于选择:活跃动态偏好在强化学习中的鲁棒性
通过引入主动动态偏好方法(Active Dynamics Preference),对系统随机参数进行有效选择,并在四个机器人运动任务中进行验证,表明此方法具有超强的适应性和鲁棒性,可有效提高机器人环境下的一致性。
- 高效的基于模型的诊断
本文介绍了一种高效的模型诊断过程,针对具有输入输出因果关系的系统。在此诊断过程中,首先确定一组可能破损的组件的焦点;其次,在焦点内确定最具信息的探测点。该诊断过程在组件的连通性低时表现出线性时间复杂度,并可应用于动态系统和包含循环的系统中, - 安全控制策略的神经证书
本文提出一种方法,通过联合学习障碍函数和类李亚普诺夫函数的神经网络来实现动态系统的安全和目标控制,该方法在摆、小车倒立杆和无人机等动态系统中得到了有效应用。
- AAAI重新思考系统健康管理
该论文提出了将系统健康管理和决策制定在制定过程中统一考虑的方法,并说明该方法如何通过建模和计算来提高系统的操作效率和降低系统的综合复杂性。
- 动态输入 / 输出自动机:动态系统的正式且组合模型
提出了一种动态 I/O 自动机(DIOA)的组件化模型,具有操作符,可以动态创建和销毁自动机,并可以动态更改其签名,它可以模拟移动性,是层次化的,并可以使用跟踪包容性进行行为子类型化。同时,该模型具备并行组合,操作隐藏,操作重命名的操作符。
- 基于高斯过程的四旋翼安全控制优化
本文介绍一种为解决调参过程可能导致的安全失败问题而开发的安全优化算法 ——SafeOpt,该算法通过将性能度量建模为高斯过程并探索高于安全性能阈值的新控制器参数来自动优化控制器参数,以实现快速、自动和安全的控制器参数优化,实验数据表明该方法 - 使用线性时间微积分理论模拟动态系统
本文研究在一个规范上执行广泛的推断任务的可行性,通过将 IDP3 扩展到与动态规范相关的领域中使用的多种推断技术。
- 时变图和动态网络
本文旨在将分布式计算文献中的各种概念、形式主义和结果整合到一个统一框架中,我们将其称为时间变化图表(TVG),并概括性地介绍它们的分类和应用。