关键词neural network controllers
搜索结果 - 10
- 连续时间下神经网络控制系统的验证
通过为连续驱动的神经网络控制系统添加抽象层,我们开发了第一个连续驱动的神经网络控制系统验证方法,并通过应用于基于视觉的自主飞机滑行系统,并与固定频率分析基线进行比较,展示了该方法的有效性。
- 通过闭环阻尼性保证合成神经网络控制器
通过基于积分二次约束的方法,本文提出一种合成神经网络控制器的方法,使得植物和控制器的反馈系统具有耗散性,并证明 L2 增益的性能要求。通过不确定性来描述植物的不确定性和神经网络的非线性,使用耗散条件导出了不确定线性时不变系统的耗散性条件,并 - 经证实的时序逻辑任务的神经符号控制在随机系统中的运用
该论文介绍了一种解决具有未知和随机系统动力学以及 LTL 编码任务的神经网络控制器的时间组合问题的新方法,该方法整合了自动机理论和数据驱动的可达性分析工具,通过基本技能的复合生成安全行为,通过数值模拟和实验验证了该方法。
- 神经网络控制系统中的正向不变性
本论文提出了一种基于区间分析和单调系统理论的框架,用于在具有神经网络控制器的非线性系统中证明和搜索正向不变集。
- AAAI神经网络控制系统可达性分析
该论文提出了一种基于 Lipschitzian 优化的 NNCS 验证框架,通过证明闭环 NNCS 的 Lipschitz 连续性并消除循环来实现,相比最先进的验证方法,DeepNNC 在各种 NNC 的效率和准确性方面表现更加优秀,并通过 - 通过可微分物理实现复杂运动技能的学习
本文提出了一种可实践的学习框架,能够输出统一的神经网络控制器,具有显著提高任务复杂性和多样性的能力,并使用可微物理学实现训练。实验结果表明,在可微弹簧和材料点方法的模拟、复杂的步态任务和多个机器人设计方案上,我们的学习框架优于强化学习,能够 - ICLRDiffTaichi: 物理模拟的可微编程
DiffTaichi 是一种新的可微编程语言,专为构建高性能的可微物理模拟器而设计,演示了它在 10 个不同物理模拟器的梯度学习和优化任务中的性能和生产力,可以用于优化神经网络控制器。
- 具有神经网络控制器的分段线性系统可达集估计与安全验证
本文提出了使用神经网络控制器的分段线性系统的可达集估算和安全性验证问题,并开发了一种逐层方法来计算修正线性单位激活函数神经网络的输出可达集。基于神经网络控制器输出可达集,可以迭代地为给定的有限时间间隔估算分段线性反馈控制系统的输出可达集,并 - 利用任务分离和爬山算法进行深度强化学习的自动驾驶车辆
本研究文章提出了一种基于模型的强化学习算法,包括任务分离和山峰爬升等策略,用于在自主驾驶中学习深度神经网络参数化控制器,并采用虚拟速度约束与最大稀疏奖励的组合。
- 深度强化学习的异步方法
提出一种使用异步梯度下降法优化深度神经网络控制器的深度强化学习框架,演示了四种标准强化学习算法的异步变体,并表明并行 actor-learner 对训练具有稳定作用。其中最佳表现的方法,即 actor-critic 的异步变体,在 Atar