- 控制仿射系统的随机特征近似
现代数据驱动控制应用需要灵活的非线性模型,以便于合理的控制器合成和实时反馈。我们提出了两个新颖的非线性特征表示类,可以捕捉控制仿射结构,同时允许在状态依赖上具有任意复杂性。我们的方法利用了随机特征(RF)逼近,以较低的计算成本继承了核方法的 - 动态和控制模型的通用验证框架与证书合成
我们提供了一个对系统规范进行编码和定义相关证明的通用框架,并提出了一种自动化的方法来形式合成控制器和证明,通过利用神经网络的灵活性提供候选控制和证明函数,同时使用 SMT 求解器提供正确性的正式保证,我们通过开发一个原型软件工具对我们的框架 - 混合系统的护盾强化学习
通过使用所谓的野蛮方法,本文提出了构建障碍盾牌的方法,通过系统地选择真实转移函数的样本,以提取基于分区的双人安全游戏的近似有限表示。尽管难以达到严格的安全保证,但我们通过原型实现和 UPPAAL STRATEGO 实验证明了强大的统计安全保 - 基于时间轴游戏的控制器合成
本文介绍了一种针对基于时间轴的游戏的控制器综合的有效且计算上最优的方法。
- 概率超性质的演绎式控制合成
提出了一种新的方法来解决马尔可夫决策过程(MDPs)和概率超性质的控制器合成问题,该方法在超级概率计时逻辑(HyperPCTL)的基础上增加了合成控制器的结构约束,采用逐步修正策略修剪搜索空间并与先前的 SMT 模型检查工具相比取得了显著的 - 基于神经抽象的控制器综合和部署
我们提出了一种利用神经网络表示以减少抽象技术的高内存需求的方法,通过校正神经网络的输出来保持整个过程的正确性,并通过提供一个新的训练算法来减少合成控制器的内存需求。
- MULTIGAIN 2.0: 面向多个平均回报、LTL 和稳定状态约束的 MDP 控制器合成
MULTIGAIN 2.0 是 MultiGain 的一个扩展工具,它基于概率模型检查器 PRISM,并在多目标控制器合成方面进行了扩展,不仅支持多维长期平均奖励结构、稳态约束和线性时间逻辑属性的概率系统的形式验证和合成,还提供了寻找有限内 - 通过正式抽象实现非高斯噪声动态系统的鲁棒控制
该研究论文提出了一种新颖的控制器合成方法,它不需要任何明确表示噪声分布的方式,而是通过将控制系统抽象为捕捉噪声的有限状态模型,然后使用从场景方法中的工具来计算可能正确的限制,基于一些噪声的有限数量样本。通过缩小合成过程的复杂性,该方法在实际 - 学习神经控制器以实现时序逻辑目标的风险感知
本文提出了基于信号时间逻辑和控制障碍函数的神经网络控制器综合算法,以优化指定性能目标并满足硬性约束条件,在飞行器和单轮车等测试系统上进行了验证。
- AAAI概率不够用:针对存在认识不确定性的随机动态模型的形式控制器综合
本文介绍一种使用区间 Markov 决策过程的抽象方式,在连续状态的模型中捕捉随机噪声和不确定参数的 aleatoric 和 epistemic 不确定性,进行控制器的综合。经实验验证,考虑 epistemic 不确定性可以提高控制器的鲁棒 - 面向时间轴游戏的控制器合成
这篇论文介绍了一种基于时间轴的规划方法,其演变受一组时间约束条件控制。为了处理一般的非确定性,提出了基于时间轴的游戏的概念,并提出了一种控制器综合方法来支持时间轴游戏中的胜利策略实现。
- 针对 MTL 约束控制 Golog 程序
本文提出利用 MTL 公式将低级别平台操作和高层级程序同时执行来简化机器人控制,并通过时序自动机控制器综合方法进行控制。
- AMYTISS:用于大规模随机系统的并行自动控制器合成
本文提出了一种名为 AMYTISS 的软件工具,用于为大规模随机系统设计构造正确控制器。该工具利用高性能计算平台和云计算服务解决了状况膨胀问题,并以几个案例研究来验证了其性能表现。
- 不确定性下的安全控制
本文提出了一种新的逻辑 PrSTL 作为表达随机性质和强制其概率保证的表现语言,并展示了如何使用这种逻辑对具有随机性质的智能物理系统进行控制器合成,其关键特点是适应性逻辑并随着系统遇到附加数据而变化,并通过合成多种情况下无人机和自主车辆的控 - 马尔科夫决策过程的安全约束强化学习
该论文研究了针对随机和部分未知环境下控制器综合的相关问题,并提出了一种基于安全的 Markov 决策过程的解决方案,并利用迭代学习过程来实现安全性和最优性的权衡。
- 概率系统容错控制器综合
本文提出了一种基于概率系统建模的控制器合成技术,该技术通过使用惩罚函数减少未来对控制器性能可能造成的影响,并最终生成一个具有多策略选择、适应性强的鲁棒性控制器。