optimal control policies | BriefGPT

关键词optimal control policies

搜索结果 - 6

缩小差距：通过神经 ODE 优化引导和控制网络
改进了导航和控制网络（G&CNETs）的准确性，通过利用包含在常微分方程（ODE）右侧的神经网络来描述空间飞行器动力学，并使用变分方程计算 ODE 对网络参数的敏感性来更新 G&CNET 参数，最终证明了该方法对轨道传输和着陆问题的准确性有
PDF2 months ago
面向任务驱动的探索，加速具有时态逻辑任务规范的深度强化学习
通过自动机表示 LTL 任务以及部分模拟未知系统动力学的神经网络，我们提出了一种新颖的深度强化学习（DRL）算法，其样本效率得以提高，能够更快速地学习控制策略，以在未知环境中的机器人导航任务中提高效率。
PDF7 months ago
复杂和连续状态行动空间的专用深度残差策略安全强化学习控制器
传统控制器有局限性，深度强化学习通过在环境中进行探索来学习最优控制策略，为安全关键环境提出专门的深度残差策略安全强化学习方法，并在 Tennessee Eastman 过程控制中进行验证。
PDF9 months ago
非参数策略梯度算法在非平稳环境中的策略调整
该研究提出了一种非参数学习的策略，通过嵌入策略分布作为非递减的欧几里得空间中的特征，从而允许其搜索空间在非常高（可能无限）维的 RKHS（再生核希尔伯特空间）中定义。同时，通过在 RKHS 中计算的相似度度量，与 Adaptive H 技术
PDF2 years ago
ICML雷电不会两次打中同一处：带有相互关联不确定性的稳健 MDPs
基于参数不确定性的马尔可夫决策过程，引入 “雷不会击中同一个地方” 原则，对关联的不确定参数进行建模，给出概率保证，并设计出可行的算法以计算最优控制策略。
PDF12 years ago
线性函数逼近与优先扫描的 Dyna-Style 规划
应用基于模型的方法通过线性函数逼近扩展 Dyna 结构还原控制策略和价值函数的问题，证明了分布无关的收敛性，提出了基于线性逼近的优先扫描算法并在实例中验证了其性能。
PDF12 years ago