BriefGPT.xyz
大模型
Ask
alpha
关键词
lyapunov stability
搜索结果 - 5
一种基于自适应稳定性认证的强化学习策略优化方法
提出自适应稳定性认证方法(ASC)保证采样优化阶段中系统的稳定性,并基于 ASC 条件设计了自适应 Lyapunov-based Actor-Critic(ALAC)算法, 在机器人任务中实现了比现有研究更低的累积成本和更少的稳定约束违规。
PDF
2 years ago
一阶方法视角下的 LQR 控制:离散时间情形
该论文探讨了在反馈增益范围内最大化一个实值矩阵函数的线性二次调节器问题,提出了几种算法,包括基于梯度的方法和牛顿迭代算法。研究表明,这些算法均具有一定的收敛性和稳定性。
PDF
5 years ago
基于物理信息的自编码器用于 Lypunov 稳定流体流动预测
该论文探讨了如何将物理先验知识加入数据驱动模型,提高模型的质量和稳定性,并以 Lyapunov 分析为视角,通过研究液体流动预测的典型问题,验证了保持 Lyapunov 稳定性的模型可以提高泛化性能并减少预测不确定性。
PDF
5 years ago
NIPS
深度学习中步长的重要性
利用梯度下降算法训练神经网络会导致产生离散时间非线性动力系统,算法步长对这些系统的收敛行为有决定性的影响并能解释实际问题中观测到的多种现象,如训练误差的恶化和深度残差网络的性能差异等。
PDF
6 years ago
具有障碍认证的自适应强化学习及其在 Brushbot 导航中的应用
本文提出了一个安全学习框架,该框架采用自适应模型学习算法以及障碍证书,用于具有可能非平稳智能体动态的系统。本文使用稀疏优化技术提取模型的动态结构,并结合控制障碍证书来保持安全。在一定条件下,保证了违反安全性后的 Lypunov 稳定恢复。最
→
PDF
6 years ago
Prev
Next